Синтезаторы речи

На страницах этой рубрики разговор пойдет о таком важном элементе любой программы экранного доступа, как синтезатор речи. По большому счету, речь - это единственный универсальный способ взаимодействия программы с незрячим или слабовидящим пользователем. Брайлевские устройства вывода (дисплеи и принтеры) уступают речевому выводу информации и по скорости, и по доступности (так как требуют от пользователя умения читать рельефно-точечный шрифт). Кроме того, брайлевские устройства вывода являются сложными техническими устройствами и зачастую недешевы.

Речевые технологии для пользователей

  1. Установка Microsoft Speech Platform
    Microsoft Speech Platform (Речевая платформа Microsoft)- 'это набор программных модулей и средств разработки, позволяющих разработчикам создавать приложения и сервисы с поддержкой речевых технологий (распознавание речи и синтез речи по тексту), а пользователям взаимодействовать с такими приложениями...
  2. Использование голосов MBROLA в среде MS Windows
    Статья знакомит с проектом MBROLA и содержит подробную инструкцию по использованию дифонных баз и средств MBROLA совместно с синтезатором речи eSpeak в операционных системах MS Windows. Выполнив указанные в статье шаги, вы сможете воспользоваться богатой коллекцией дифонных баз MBROLA, созданных для различных языков мира.
  3. Обозначения языков в eSpeak
    В статье представлен перечень обозначений языков, используемых в настройках и командах синтезатора речи eSpeak.
  4. Введение или о синтезе речи просто и понятно
    Любая программа экранного доступа, а также любая программа, предполагающая взаимодействовать с незрячим или слабовидящим пользователем, должна поддерживать невизуальные средства вывода информации. На сегодняшний день такими средствами являются либо речь, либо тактильное воздействие. Остановимся подробнее на речевом выводе информации...
  5. Установка Microsoft SAPI
    Краткая инструкция по установке пакетов MS SAPI 4 и MS SAPI 5, необходимых для поддержки речевых технологий в операционных системах MS Windows.
  6. Утилита для восстановления SAPI 5 ключей реестра
    В процессе установки или удаления (деинсталляции) некоторых SAPI5-голосов в системном реестре Windows могут произойти изменения, которые приводят к неработоспособности оставшихся SAPI5-голосов. Для исправления подобных ошибок...

Речевые технологии для разработчиков

  1. Синтезирование речи из приложения Windows 8.1 через Windows.Media.SpeechSynthesis
    В Windows 8.1 Preview был введён новый API - Windows.Media.SpeechSynthesis, предназначенный для преобразования текста в речь. По задумке Microsoft, он может использоваться для создания голосовых подсказок пользователю, советов по навигации или любых других задач, требующих чтения текста вслух. На момент версии Windows 8.1 Preview, данный API предоставляет следующие возможности...
  2. Речевые технологии для разработчиков (вводная статья)
  3. Простой пример использования SAPI 5.x в программах на C/C++
    На примере простого консольного приложения ниже будет описан способ использования синтеза речи по тексту для MS SAPI 5.x. В примере приведен код для SAPI 5.1, но принципиальных отличий в использовании SAPI 5.3 (MS Windows Vista) и SAPI 5.4 (MS Windows 7) нет...
  4. Использование MS Speech API 4.0 в программах на FreeBASIC
    Поскольку компоненты MS Speech API 4 (MS SAPI 4) реализованы как серверы OLE автоматизации, то, взяв их в качестве примера, мы разберемся в том, как работать с подобными компонентами в программах на FreeBASIC...
  5. Использование MS Speech API 5.1 в программах на FreeBASIC
    Для взаимодействия с компонентами Microsoft Speech API 5.1 (MS SAPI 5.1) из программы на FreeBasic мы воспользуемся функциями библиотеки DispHelper...
  6. Библиотека SAPI_DLL
    Библиотека SAPI_DLL создана для облегчения доступа к интерфейсам MS Speech API для синтеза речи по тексту. Для того что бы научить Ваше приложение "разговаривать", достаточно вызвать простые процедуры из SAPI_DLL.
  7. Теги речевой разметки в SAPI 4
  8. Использование MS Agent в Visual Basic
  9. Speech API в Delphi (часть 1)
    Хотите чтобы Делфи заговорил - читайте эту страницу!
  10. Speech API в Delphi (часть 2)
  11. MS Agent и Delphi

Какие синтезаторы речи говорят по-русски

  1. eSpeak

    eSpeak - это компактный мультиязычный некоммерческий программный синтезатор речи, разработанный Джонатаном Дуддингтоном (англ. Jonathan Duddington). Синтезатор поддерживает 37 языков, распространяется по свободной лицензии GNU GPL v3+ (GNU General Public License) и открыт для доработок и усовершенствований. Существует версия eSpeak для таких операционных систем, как Linux, Mac OS, Microsoft Windows и RISC OS, а также он доступен в виде исходного кода на языке C++. Для семейства ОС Windows eSpeak представлен как SAPI 5 -совместимый синтезатор.

  2. Капитан (версия для MS SAPI 5)

    Синтезатор речи "Капитан" представляет собой некоммерческий MS SAPI5-совместимый русскоязычный синтезатор. Основной голос (русский и псевдо-украинский языки) обладает удовлетворительной разборчивостью речи, но низкой естественностью звучания (то есть речь "механическая"). хорошая разборчивость речи и быстрая реакция делают синтезатор удобным для работы с программами экранного доступа. Кроме основного голоса, этот пакет способен поддерживать сторонние голоса (например, Newfon), предоставляя доступ к ним через интерфейсы MS SAPI5.

  3. Chatterbox

    Это некоммерческий SAPI 5-совместимый синтезатор речи, обладающий двумя голосами: русским и английским, что позволяет более-менее корректно озвучивать смешанные тексты. Синтезатор поддерживает два режима работы: исключительно русский и русско-английский.

  4. «Олег» (RusEngineS5_22)

    Это некоммерческий синтезатор русской речи, совместимый с SAPI 5. Синтезатор обладает быстрой реакцией, высокой разборчивостью речи. Есть возможность редактировать словари ударений и подстановок, представленных в виде текстовых файлов.

  5. «Голос»

    Речевой синтезатор «Голос» способен читать тексты на русском и украинском языках, обладает относительно высокой естественностью речи, поддерживает пользовательский словарь. Синтезатор распространяется бесплатно и совместим с MS SAPI 5.x.

  6. Speaking Mouse

    Качество речи этого некоммерческого синтезатора оставляет желать лучшего. Однако, он обладает двумя преимуществами: мгновенной реакцией и хорошей фонетической разборчивостью. То есть, если вам удастся привыкнуть к тому "кряканию", которое порождает этот синтезатор, то вы легко сможете определять на слух даже орфографические ошибки в читаемом тексте.
    Синтезатор предназначен исключительно для работы с программой экранного доступа JAWS for Windows.

  7. «Говорящая мышь» от Сергея Волкова

    Существенно переработаная коммерческая версия синтезатора Speaking Mouse.
    Автор доработок: Сергей Волков.
    Добавлены некоторые настройки и словарь, исправлены ошибки.

  8. Digalo 2000 Russian (ELAN Speech)

    Этот синтезатор имеет высокую разборчивость и качество речи. Им удобно и приятно читать книги, однако он недостаточно хорош для полноценной работы с программами экранного доступа, так как очень нетороплив и медленно реагирует на запросы скринридера . Для работы требует компонент Microsoft SAPI версии 4

  9. ELAN Speech Cube(ELAN Speech)

    Этот синтезатор является развитием синтезатора Digalo и специфицирован для работы совместно с Microsoft SAPI 5. От предыдущей своей реализации отличается более высоким быстродействием. Для работы требуется Microsoft SAPI версии 5.x

  10. L&H tts 3000 Russian (Lernout & Hauspie)

    Несмотря на то, что этот синтезатор, как и Digalo, использует Microsoft SAPI, по качеству речи он значительно уступает Digalo, а по скорости работы - Speaking Mouse. Достоинствами этого синтезатора являются наличие двух голосов (мужского и женского). Поддерживает возможность редактировать произношение. Для работы необходим компонент Microsoft SAPI версии 4.

  11. Newfon

    Этот синтезатор является адаптацией синтезатора речи «Фонемафон» для работы совместно с программой экранного доступа NVDA. Поддерживается синтез русской и украинской речи (на основе русских фонем).


Распространение материалов сайта означает, что распространитель принимает условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2017
Rambler's Top100