Технология синтеза речи Яндекса теперь воспроизводит эмоции

25.11.2014 | Текст: userator

7fd54b29e3d045c6a88b89a1370ddce8На днях Приложение Яндекс.Диктовка для интерактивного написания и редактирования текста голосом появилось в AppStore и Google Play. Основная цель — демонстрация новых возможностей комплекса речевых технологий Яндекса.

С помощью бесплатного мобильного API, предоставляемого компанией Яндекс, можно, к примеру, распознавать адреса и голосовые запросы для поиска. За 2014 год компания довела его качество почти до того же уровня, на котором такие запросы и реплики понимают сами люди.

Помимо этого синтез речи может озвучить любой текст мужским или женским голосом, да ещё и задав нужную эмоцию. Что интересно, SpeechKit позволяет окрасить синтезированный голос параметрами «пьяный» или «больной». С уверенностью можно сказать, что аналогов синтеза речи с подобной функцией на данный момент нет во всем мире.

«Ни у одного из известных нам голосовых движков на рынке нет такой возможности.»

Изначально SpeechKit работал только для поисковых запросов. Сейчас же это не просто «голосовая» клавиатура, но универсальный интерфейс, способный полностью заменить любое взаимодействие с системой живого разговора.

d019ab5cf67447aa9f1411647983e384«Например, во фразе „поехали на улицу Льва Толстого“ слово „улица“ помогает системе определить контекст, после чего в базе данных Яндекс.Карты находится соответствующий объект.»

Планы Яндекса

Хорошие новости для студентов и журналистов. Компания ставит перед собой задачу научиться распознавать спонтанную речь, чтобы можно было прямо в реальном времени расшифровать интервью или автоматически конспектировать лекцию, получая на выходе уже размеченный текст, с выделенными тезисами и ключевыми фактами.

Не забывайте, что для развития SpeechKit очень важна обратная связь.

«Поставьте Яндекс.Диктовку, разговаривайте с ней почаще — чем больше данных мы получаем, тем быстрее растёт качество распознавания в доступной всем вам библиотеке.»

Обо всём этом, а также о некоторых других возможностях SpeechKit читайте в блоге Яндекса.

by Mr. Роман Морозов and & Ms. Наталья Чердак

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *