Искусственный интеллект IBM генерирует голос человека за 5 минут разговора Окт 02, 2019 | 10:29 / Технологические новшества

Компания IBM создала новый ИИ-алгоритм, который через пять минут после ознакомления с голосом собеседника, способен самостоятельно произносить любой текст его голосом.

По заверению компании, новый ИИ-алгоритм способен в режиме реального времени строить диалоги и адаптироваться к различным стилям разговора и тембрам голоса. Разработчики отмечают, что благодаря синтезу нейронной речи на основе модульной архитектуры им «удалось создать реалистичный компьютерный голос».

Система состоит из трех составных частей: предиктора функции просодии, предиктора акустических характеристик и нейронного вокодера. Совместно все три компонента позволяют максимально точно определить стиль говорящего, а также подстроить высоту и энергию подачи речи с учетом акустических искажений. По данным компании, для обучения нейросети достаточно лишь пяти минут прослушивания собеседника.

Ознакомиться с примерами звучания нового синтезатора речи можно на сайте сервиса IBM Watson.

infocity.az

Начинайте свою трудовую деятельность с нами!
Читать дальше
Доверьтесь нашим креативным и своеобразным идеям!
Читать дальше
Печатные издания в высоком цветном качестве и за доступную цену!
Читать дальше
Развивайте свою карьеру, повышая знания в сфере ИТ!
Читать дальше
Разнообразные услуги электронной библиотеки!
Читать дальше