Синтезаторы речи

На страницах этой рубрики разговор пойдет о таком важном элементе любой программы экранного доступа, как синтезатор речи. По большому счету, речь - это единственный универсальный способ взаимодействия программы с незрячим или слабовидящим пользователем. Брайлевские устройства вывода (дисплеи и принтеры) уступают речевому выводу информации и по скорости, и по доступности (так как требуют от пользователя умения читать рельефно-точечный шрифт). Кроме того, брайлевские устройства вывода являются сложными техническими устройствами и зачастую недешевы.

Речевые технологии для пользователей

  1. Установка Microsoft Speech Platform
    Microsoft Speech Platform (Речевая платформа Microsoft)- 'это набор программных модулей и средств разработки, позволяющих разработчикам создавать приложения и сервисы с поддержкой речевых технологий (распознавание речи и синтез речи по тексту), а пользователям взаимодействовать с такими приложениями...
  2. Использование голосов MBROLA в среде MS Windows
    Статья знакомит с проектом MBROLA и содержит подробную инструкцию по использованию дифонных баз и средств MBROLA совместно с синтезатором речи eSpeak в операционных системах MS Windows. Выполнив указанные в статье шаги, вы сможете воспользоваться богатой коллекцией дифонных баз MBROLA, созданных для различных языков мира.
  3. Обозначения языков в eSpeak
    В статье представлен перечень обозначений языков, используемых в настройках и командах синтезатора речи eSpeak.
  4. Введение или о синтезе речи просто и понятно
    Любая программа экранного доступа, а также любая программа, предполагающая взаимодействовать с незрячим или слабовидящим пользователем, должна поддерживать невизуальные средства вывода информации. На сегодняшний день такими средствами являются либо речь, либо тактильное воздействие. Остановимся подробнее на речевом выводе информации...
  5. Установка Microsoft SAPI
    Краткая инструкция по установке пакетов MS SAPI 4 и MS SAPI 5, необходимых для поддержки речевых технологий в операционных системах MS Windows.
  6. Утилита для восстановления SAPI 5 ключей реестра
    В процессе установки или удаления (деинсталляции) некоторых SAPI5-голосов в системном реестре Windows могут произойти изменения, которые приводят к неработоспособности оставшихся SAPI5-голосов. Для исправления подобных ошибок...

Речевые технологии для разработчиков

  1. Тайный язык незрячих людей, но это не шрифт Брайля
    Эта статья интересна не только тем, что рассказывает об особенностях восприятия синтезированной речи незрячими пользователями компьютеров и смартфонов, но и тем, что в разговоре принимает участие один из разработчиков широко известной и популярной бесплатной программы экранного доступа NVDA.
  2. Синтезирование речи из приложения Windows 8.1 через Windows.Media.SpeechSynthesis
    В Windows 8.1 Preview был введён новый API - Windows.Media.SpeechSynthesis, предназначенный для преобразования текста в речь. По задумке Microsoft, он может использоваться для создания голосовых подсказок пользователю, советов по навигации или любых других задач, требующих чтения текста вслух. На момент версии Windows 8.1 Preview, данный API предоставляет следующие возможности...
  3. Речевые технологии для разработчиков (вводная статья)
  4. Простой пример использования SAPI 5.x в программах на C/C++
    На примере простого консольного приложения ниже будет описан способ использования синтеза речи по тексту для MS SAPI 5.x. В примере приведен код для SAPI 5.1, но принципиальных отличий в использовании SAPI 5.3 (MS Windows Vista) и SAPI 5.4 (MS Windows 7) нет...
  5. Использование MS Speech API 4.0 в программах на FreeBASIC
    Поскольку компоненты MS Speech API 4 (MS SAPI 4) реализованы как серверы OLE автоматизации, то, взяв их в качестве примера, мы разберемся в том, как работать с подобными компонентами в программах на FreeBASIC...
  6. Использование MS Speech API 5.1 в программах на FreeBASIC
    Для взаимодействия с компонентами Microsoft Speech API 5.1 (MS SAPI 5.1) из программы на FreeBasic мы воспользуемся функциями библиотеки DispHelper...
  7. Библиотека SAPI_DLL
    Библиотека SAPI_DLL создана для облегчения доступа к интерфейсам MS Speech API для синтеза речи по тексту. Для того что бы научить Ваше приложение "разговаривать", достаточно вызвать простые процедуры из SAPI_DLL.
  8. Теги речевой разметки в SAPI 4
  9. Использование MS Agent в Visual Basic
  10. Speech API в Delphi (часть 1)
    Хотите чтобы Делфи заговорил - читайте эту страницу!
  11. Speech API в Delphi (часть 2)
  12. MS Agent и Delphi

Синтезаторы речи

  1. eSpeak
    eSpeak - это компактный мультиязычный некоммерческий программный синтезатор речи, разработанный Джонатаном Дуддингтоном (англ. Jonathan Duddington). Синтезатор поддерживает 37 языков, распространяется по свободной лицензии GNU GPL v3+ (GNU General Public License) и открыт для доработок и усовершенствований. Существует версия eSpeak для таких операционных систем, как Linux, Mac OS, Microsoft Windows и RISC OS, а также он доступен в виде исходного кода на языке C++. Для семейства ОС Windows eSpeak представлен как SAPI 5 -совместимый синтезатор.
  2. RHVoice
    Синтезатор RHVoice и пакеты голосов к нему разработаны Ольгой Яковлевой для применения в операционных системах GNU/Linux, Microsoft Windows и на устройствах под управлением Android. На сегодняшний день это наилучший свободный синтезатор русской речи (а также других языков) по соотношению отзывчивости и естественности звучания. Синтезатор представляет собой проект с открытым исходным кодом и распространяется бесплатно.
  3. RHVoice — Сборка с украинским голосом
    Синтезатор RHVoice с поддержкой украинского языка. Данная версия является тестовой. Пакет собран и поддерживается инициативной группой, в которую входят Володимир Пиріг, Дмитрий Билак, Евгений Мицук и другие участники.
    Доступны для скачивания три варианта:
    • Синтезатор украинской речи Анатоль для SAPI 5 (под Windows),
    • Синтезатор украинской речи Анатоль для программы NVDA (под Windows),
    • Синтезатор украинской речи Анатоль для устройств под управлением Android.
  4. Sakrament «Людмила»
    Синтезатор белорусской и русской речи Sakrament «Людмила», совместимый с речевым интерфейсом MS SAPI 5 для операционных систем Microsoft Windows. Синтезатор распространяется бесплатно.
  5. Капитан (версия для MS SAPI 5)
    Синтезатор речи «Капитан» - это некоммерческий MS SAPI5-совместимый русскоязычный синтезатор. Основной голос (русский и псевдо-украинский языки) обладает удовлетворительной разборчивостью речи, но низкой естественностью звучания (то есть речь "механическая"). хорошая разборчивость речи и быстрая реакция делают синтезатор удобным для работы с программами экранного доступа. Кроме основного голоса, этот пакет способен поддерживать сторонние голоса (например, Newfon), предоставляя доступ к ним через интерфейсы MS SAPI5 (что было актуально до появления версии Newfon, совместимой с MS SAPI, см. ниже).
  6. Капитан для NVDA
    Данная версия синтезатора представляет собой дополнение для программы экранного доступа NVDA, совместимое с NVDA 2012.3 и новее. Основные возможности:
    Синтез речи на русском и украинском языках с регулировкой скорости, громкости и высоты голоса (поддержка украинского реализована на основе русской фонемной базы).
    Поддержка расширенного набора буквенных символов, включающего всю кириллицу, латиницу и греческий алфавит, в том числе буквы с диакритическими знаками и вариантные формы букв.
    Поддержка функции автоматического переключения языков на лету, если читаемый текст содержит соответствующую разметку.
    Настраиваемый вариант обработки некириллического текста: русская транслитерация латиницы, подражание английскому произношению и перенаправление на встроенный в NVDA синтезатор речи eSpeak NG или установленный в системе синтезатор стандарта SAPI5.
    Отдельные от NVDA пользовательские словари замены, а также механизм конфигурирования описаний букв и небуквенных символов, дифференцированные по языкам и вариантам обработки латиницы.
    Отдельно настраиваемые паузы в речи: между словами, между частями предложений и между предложениями.
    Ряд дополнительных настроек произнесения букв, цифр и прочих неалфавитных символов.
  7. Chatterbox
    Это некоммерческий SAPI 5-совместимый синтезатор речи, обладающий двумя голосами: русским и английским, что позволяет более-менее корректно озвучивать смешанные тексты. Синтезатор поддерживает два режима работы: исключительно русский и русско-английский.
  8. «Голос»
    Речевой синтезатор «Голос» способен читать тексты на русском и украинском языках, обладает относительно высокой естественностью речи, поддерживает пользовательский словарь. Синтезатор распространяется бесплатно и совместим с MS SAPI 5.x.
  9. Speaking Mouse
    Качество речи этого некоммерческого синтезатора оставляет желать лучшего. Однако, он обладает двумя преимуществами: мгновенной реакцией и хорошей разборчивостью. То есть, если вам удастся привыкнуть к тому "кряканию", которое порождает этот синтезатор, то вы легко сможете определять на слух даже орфографические ошибки в читаемом тексте.
    Синтезатор предназначен исключительно для работы с программой экранного доступа JAWS for Windows.
  10. «Говорящая мышь» от Сергея Волкова
    Существенно переработаная коммерческая версия синтезатора Speaking Mouse.
    Автор доработок: Сергей Волков.
    Добавлены некоторые настройки и словарь, исправлены ошибки.
  11. Newfon (SAPI-совместимый)
    Этот синтезатор является развитием синтезатора речи «Фонемафон» и поддерживает интерфейс MS SAPI 5.x. Синтезатор отличается быстрой отзывчивостью и низкой естественностью речи, чем и снискал популярность у своих поклонников.

Метки


Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2024