Узнавайте о новых статьях по почте

 

Речевые технологии Yandex.SpeechKit

Автор / 10 комментариев / 3962 Просмотров / 27.09.2016

 

 

Уже на протяжении многих лет для своих роликов пользуюсь синтезом речи Milena TTS [Русский], разработчик Nuance. Это придаёт некоторую пикантность и если начинаю экспериментировать с другими движками получаю в комментариях хэштег #ВернитеДашку. Прикольно всё это наблюдать, но процесс не стоит на месте и многие компании разрабатывают собственные технологии. Например мне понравился голос Ivona Maxim, который также иногда впихиваю в видео.

Недавно наткнулся на комплекс речевых технологий Яндекса, включающий распознавание и синтез речи, голосовую активацию и выделение смысловых объектов в произносимом тексте. Речевые технологии Yandex.SpeechKit научился распознавать голосовую активацию, с её помощью можно записывать sms сообщения и оставлять заметки голосом, не используя клавиатуру, напрямую обращаться к тому бэкэнду, который успешно применяется в мобильных приложениях Яндекса. Например SpeechKit Mobile SDK позволяет встроить распознавание и синтез речи, а также голосовую активацию Яндекса в мобильное приложение для iOS, Android (на данный момент русский, английский, турецкий и украинский языки) или Windows Phone (русский язык). Голосовое управление сделает ваше приложение более удобным для пользователя, особенно если у пользователя заняты руки. Не касаясь экрана, он сможет вызвать нужную функцию одной фразой.

Меня всегда привлекала технология синтеза речи, которая позволяет переводить текст в речь. Быстро набросал текст, озвучил его голосом RobotSuperDazhka (Milena TTS [Русский]) и впихнул в ролик, на любую тематику. Особенно это будет интересно пользователям имеющим проблемы с речью или тем кто по каким-либо причинам стесняется своего голоса.

Голоса от Яндекс показались своеобразными, симпатичными и легко воспринимаемыми человеческим ухом, особенно мужские голоса zahar и ermil. Женские голоса jane, oksana, alyss и omazh дико напугали и на мой взгляд не дотягивают до вершин SuperDazhki. Так как же услышать новые голоса на обычном домашнем компьютере? Для этого пришлось перелопатить интернет и решение было найдено в виде обычно скрипта.

1. Для начала нам нужно оказаться на странице SpeechKit Cloud и нажать на кнопку «Кабинет разработчика».

 


 

 

Авторизоваться через аккаунт Яндекса.

 


 

 

Сразу попадаете в личный кабинет и нажимаем кнопку «Получить ключ». Далее жмакаем по кнопке «SpeechKit Cloud».

 


 

 

Заполняем все поля помеченные красной звёздочкой и нажимаем кнопку «Отправить».

 


 

 

Ключ мгновенно будет получен, после чего его нужно скопировать.

 


 

 

Теперь перейдём по этой ссылке, где увидим различные параметры запроса, speaker (голос синтезированной речи), формат ответов и примеры URL. Эта Китайская грамота обычному пользователю покажется слишком сложной, поэтому упростим наши действия (или наоборот усложним) организовав простой скрипт.

2. Качаем программу Notepad++ на свой компьютер (ссылка). Устанавливаем.

3. Создадим файл index.html. У кого нет желания создавать в ручную, скачайте по этой ссылке.

Открываем блокнот и нажимаем «Файл» — Сохранить как…

 


 

 

Меняем имя файла: index.html. Тип файла: Все файлы. Кодировка: UTF-8. Нажимаем кнопку «Сохранить». Важно сохранить файл index.html в корне системного диска или в любой папке на системном диске.

 


 

 

Теперь сохранённый файл нужно отредактировать. Откройте файл при помощи Notepad++.

 


 

 

Собственно вот наш долгожданный скрипт (скачать). Правильно отредактируйте свой файл: вставьте в нужное место свой ключ, поменяйте голос, сохраните и пользуйтесь.

 


 

 

В дальнейшем два раза щёлкаем по файлу index.html и в браузере получаем следующее.

 


 

 

Осталось в большом окне написать стихотворение и zahar (или любой другой выбранный персонаж) вам его прочитает. Не спорю возможно, что я здесь разложил по полочками никому и завтра не нужно, просто мне был интересен сам процесс синтеза речи от Яндекс на своём компьютере, чем с вами и поделился.

 

 
Помогите проекту в его развитии:
Карта Сбербанка: 676280139020834994
Яндекс.Деньги: 410012054992141
Webmoney: WMR-кошелёк R429054927097
WMZ-кошелёк Z401294377967

Помогите жертве капиталистического катаклизма. Делитесь постом в соц. сетях:

Самое интересное на сайте:

Озвучка иностранных фильмов компьютерным голосом...  // Жизнь хитра. Когда у вас на руках все козыри, она внезапно решает играть в шахматы. Просто цитата)  ...
Режим чтения или применение голосовых движков в Fi...  // Розочка, что я тебе имею сказать… Ты, конечно, сегодня произвела на пляже фурор, но… Стринги таки, надо одевать узкой ...
Компьютерный голос Ivona Maxim  // Раньше погулять отпрашивалась у мамы, теперь у мужа. Блин... у мамы проще было... Просто шутка-юмора)Как только с...
Голосовой движок Milena Порой всё, что нам нужно — услышать знакомый голос.На нашем сайте практически в обязательном порядке к каждой статье будет прикреплён видео ролик....

Комментариев 10

  1. Прикольная читалка ))) Подскажите, пожалуйста, как исправить чтобы бралось содержимое div блока по id

  2. Все разобрался! Спасибо за интересный пост!

  3. Ввел тест в поле браузера но ничего не происходит. Что нажимать то? 🙁

  4. Олег, ты пишешь что возможно эта тематика никому не интересна. Думаю как раз наоборот. Развивай пожалуйста тематику. Например распознавание речи и ввод результата в текстовое поле можно интересно применить на практике. Те же технологии Yandex SpeechКit.
    Добавил твой сайт в закладки.
    P.S. Иногда капча ошибку выдает… Не с первого раза коммент добавляется.

  5. Жаль, что всего на месяц…потом за деньги

  6. Кстати, как вариант использования:
    https://webasr.yandex.net/ttsdemo.html

  7. А как записывать полученный файл в звуковой?

  8. Подскажите, как озвучить содержимое div блока?

  9. А можно эти голоса как-нибудь прикрутить к балаболке?

Ваш Комментарий

Не парьтесь, авторизоваться на сайте можно, через любую соцсеть: 

Email не будет опубликован на сайте