Речевые технологии Yandex.SpeechKit | Сайт oleglav

Узнавайте о новых статьях по почте

 

Речевые технологии Yandex.SpeechKit

Автор / 0 Комментариев / 951 Просмотров / 27.09.2016

 

 

Уже на протяжении многих лет для своих роликов пользуюсь синтезом речи Milena TTS [Русский], разработчик Nuance. Это придаёт некоторую пикантность и если начинаю экспериментировать с другими движками получаю в комментариях хэштег #ВернитеДашку. Прикольно всё это наблюдать, но процесс не стоит на месте и многие компании разрабатывают собственные технологии. Например мне понравился голос Ivona Maxim, который также иногда впихиваю в видео.

Недавно наткнулся на комплекс речевых технологий Яндекса, включающий распознавание и синтез речи, голосовую активацию и выделение смысловых объектов в произносимом тексте. Речевые технологии Yandex.SpeechKit научился распознавать голосовую активацию, с её помощью можно записывать sms сообщения и оставлять заметки голосом, не используя клавиатуру, напрямую обращаться к тому бэкэнду, который успешно применяется в мобильных приложениях Яндекса. Например SpeechKit Mobile SDK позволяет встроить распознавание и синтез речи, а также голосовую активацию Яндекса в мобильное приложение для iOS, Android (на данный момент русский, английский, турецкий и украинский языки) или Windows Phone (русский язык). Голосовое управление сделает ваше приложение более удобным для пользователя, особенно если у пользователя заняты руки. Не касаясь экрана, он сможет вызвать нужную функцию одной фразой.

Меня всегда привлекала технология синтеза речи, которая позволяет переводить текст в речь. Быстро набросал текст, озвучил его голосом RobotSuperDazhka (Milena TTS [Русский]) и впихнул в ролик, на любую тематику. Особенно это будет интересно пользователям имеющим проблемы с речью или тем кто по каким-либо причинам стесняется своего голоса.

Голоса от Яндекс показались своеобразными, симпатичными и легко воспринимаемыми человеческим ухом, особенно мужские голоса zahar и ermil. Женские голоса jane, oksana, alyss и omazh дико напугали и на мой взгляд не дотягивают до вершин SuperDazhki. Так как же услышать новые голоса на обычном домашнем компьютере? Для этого пришлось перелопатить интернет и решение было найдено в виде обычно скрипта.

1. Для начала нам нужно оказаться на странице SpeechKit Cloud и нажать на кнопку «Кабинет разработчика».

 


 

 

Авторизоваться через аккаунт Яндекса.

 


 

 

Сразу попадаете в личный кабинет и нажимаем кнопку «Получить ключ». Далее жмакаем по кнопке «SpeechKit Cloud».

 


 

 

Заполняем все поля помеченные красной звёздочкой и нажимаем кнопку «Отправить».

 


 

 

Ключ мгновенно будет получен, после чего его нужно скопировать.

 


 

 

Теперь перейдём по этой ссылке, где увидим различные параметры запроса, speaker (голос синтезированной речи), формат ответов и примеры URL. Эта Китайская грамота обычному пользователю покажется слишком сложной, поэтому упростим наши действия (или наоборот усложним) организовав простой скрипт.

2. Качаем программу Notepad++ на свой компьютер (ссылка). Устанавливаем.

3. Создадим файл index.html. У кого нет желания создавать в ручную, скачайте по этой ссылке.

Открываем блокнот и нажимаем «Файл» — Сохранить как…

 


 

 

Меняем имя файла: index.html. Тип файла: Все файлы. Кодировка: UTF-8. Нажимаем кнопку «Сохранить». Важно сохранить файл index.html в корне системного диска или в любой папке на системном диске.

 


 

 

Теперь сохранённый файл нужно отредактировать. Откройте файл при помощи Notepad++.

 


 

 

Собственно вот наш долгожданный скрипт (скачать). Правильно отредактируйте свой файл: вставьте в нужное место свой ключ, поменяйте голос, сохраните и пользуйтесь.

 


 

 

В дальнейшем два раза щёлкаем по файлу index.html и в браузере получаем следующее.

 


 

 

Осталось в большом окне написать стихотворение и zahar (или любой другой выбранный персонаж) вам его прочитает. Не спорю возможно, что я здесь разложил по полочками никому и завтра не нужно, просто мне был интересен сам процесс синтеза речи от Яндекс на своём компьютере, чем с вами и поделился.

 


 
Помогите проекту в его развитии:
Карта Сбербанка: 676280139020834994
Яндекс.Деньги: 410012054992141
Webmoney: WMR-кошелёк R429054927097
WMZ-кошелёк Z401294377967

Помогите жертве капиталистического катаклизма. Делитесь постом в соц. сетях:

Комментарии: