Приложение на базе искусственного интеллекта преобразует речь в напечатанный текст

07 Март 2018 - 13:50 | Технологические новшества
Приложение на базе искусственного интеллекта преобразует речь в напечатанный текст

Новый бесплатный сервис Otter наверняка заинтересует тех, кому по роду своей работы приходится записывать разговорную речь и затем преобразовывать ее в печатный текст. Он был представлен на Mobile World Congress 2018.

Подобные бесплатные приложения — уже давно не новинка. Их общий недостаток – множество неточностей при составлении текста. В свою очередь, хорошие, качественные приложения весьма дороги. От них Otter отличается наличием искусственного интеллекта, который преобразует речь в режиме реального времени. Для синтеза искусственной речи уже созданы перспективные алгоритмы, на которые и ориентирован Otter. Один из них – Google DeepMind, отличающийся удивительной точностью и ясностью.

Otter прост в использовании. Приложение начинает действовать с нажатием кнопки «Запись». Как только пользователь начинает говорить, на дисплее смартфона появляется черновик текстового варианта. После завершения высказывания в дело вступает искусственный интеллект, который редактирует текст.

Приложение обладает полезной особенностью. При проведении интервью Otter идентифицирует обоих его участников, разделяя текст на понятные реплики. Для этого интервьюер перед началом диалога должен оставить «голосовой отпечаток», прочитав на микрофон несколько предложений.

К недостаткам приложения стоит отнести трудности с расстановкой знаков препинания, проблемы работы в многолюдных местах или в помещениях, где много шума, однако его разработчики обещают со временем довести его до «ума». 

techcult.ru