하지만 TTS를 통해 나오는 목소리는 상당히 정적이고 로봇같다. 그런데 IBM의 새로운 AI 어시스턴트는 그렇지 않다. 이 기술 회사는 오랜 시간 동안 실제 사람같은 목소리를 내는 AI 어시스턴트를 만들기 위해 노력했다. 사람처럼 억양이 있고 감정이 깃든 목소리가 필요했던 것이다.
IBM의 AI 목소리 찾기 프로젝트인 프로젝트 디베이터(Project Debater)의 책임자 앤디 애런은 할리우드 영화 및 TV 프로그램을 보면서 IBM의 AI 어시스턴트를 위한 완벽한 음성 변환 방법을 찾아냈다.
애런은 IBM 왓슨 소프트웨어를 비롯한 일반적인 TTS 기술보다 높은 수준의 기술을 디베이터에 적용하기를 원했다. 또 여러 가지 감정과 복잡함을 표현할 수 있는 음성 프로필을 AI 어시스턴트에 적용하고자 했다.
그는 어려운 대본 읽기 및 보컬 테스트를 거친 약 20명의 성우들과 함께 최고의 음을 만들어냈다.
연기자이자 성우인 엘리자 포스가 디베이터 로봇 목소리의 기초를 담당했다. 포스는 기술 회사에 자신의 목소리를 제공하지 않지만 이번 프로젝트 디베이터에는 참여하게 됐다.
애런은 이번 작업이 그가 여태까지 했던 일 중 가장 어려운 TTS 프로젝트였다고 말했다. 하지만 그는 곧 출시될 IBM의 새로운 AI 어시스턴트 왓시나(Watsina)가 사용자들을 만족시킬 수 있을 것이라고 자신하고 있다. 왓시나의 목소리는 마치 사람처럼 자연스럽고 부드럽게 들린다.
■ 보안 사건사고 제보 하기
★정보보안 대표 미디어 데일리시큐 / Dailysecu, Korea's leading security media!★
저작권자 © 데일리시큐 무단전재 및 재배포 금지