Стало доступно обновление речевого сервера Multispeech версии 4.3.0, разрабатываемого Игорем Порецким для операционных систем Linux. Это многоязычный речевой сервер с поддержкой русского, английского, немецкого, французского, итальянского, испанского и португальского языков и возможностью автоматического переключения синтезаторов в зависимости от языка читаемого текста. Он может работать как по протоколу Emacspeak, так и подключаться через специально поставляемый модуль к речевому серверу Speech Dispatcher в виде многоголосого синтезатора на базе синтезаторов ru_tts, MBROLA и eSpeak.
Среди основных нововведений Multispeech 4.3.0 выделяются:
- Включено явное обозначений ударений для русского языка.
- Поддержка явного обозначения ударений в бэкэнде ru_tts. В итоге, встроенный ru_tts теперь может на ходу менять ударение в своей речи, если оно расставлено в исходном тексте при помощи общеупотребимого знака U+301, который, в частности, используется для этой задачи в Википедии. Например, эту функцию можно опробовать при чтении следующего четверостишья:
Отлетела от костра
Интересующиеся, но не использующие Multispeech, для понимания могут прочитать вышеприведённый пример при помощи синтезатора речи RHVoice, в котором, начиная с версии 1.2.3, есть аналогичная функциональность.
И погасла быстро:
Коль неверно, то искра́,
Если верно — и́скра! - Улучшение правил русской транслитерации латиницы.
- Немного упрощена структура конфигурации.
- Исправление механизма определения испанского языка.
Отметим, что первые три пункта являются доработками для улучшения речи русских синтезаторов, в частности, встроенного ru_tts, но они реализованы на уровне Multispeech, который выполняет предобработку входной текстовой строки с преобразованием знака ударения U+301 и нескольких латинских букв в понятные ru_tts конструкции. Таким образом, данные улучшения будут заметны лишь при использовании ru_tts именно в составе Multispeech.
Собранные релизы и исходный код Multispeech доступны в репозитории проекта на GitHub. Также Multispeech входит в состав специального набора пакетов средств невизуального доступа на базе Emacspeak.
Социальные сети