Использование оптического распознавания символов в программе JAWS

Дата публикации:03.08.2012
Twitter Facebook Vkontakte

В программе экранного доступа JAWS for Windows версии 13.0 был реализован функционал оптического распознавания символов, который позволяет незрячим пользователям получить информацию о текстовом содержимом экрана, представленным чисто в графической форме, например, в виде картинки с изображёнными на ней буквами или цифрами.

Данная функция получила название "Convenient OCR", и хотя, на наш взгляд, наиболее адекватный перевод этого словосочетания на русский язык звучит как "Подручное OCR", в официальной локализации JAWS от компании "Элита Групп" функция фигурирует под названием "Система оптического распознавания". Поэтому в дальнейшем тексте статьи будет использоваться именно этот термин.

Работа Системы оптического распознавания в JAWS основана на технологии OmniPage от компании Nuance Communications, которая более распространена в странах Европы и Северной Америки, нежели привычная русскоговорящим пользователем технология FineReader компании ABBYY.

Базовый дистрибутив JAWS не включает в себя системные компоненты, отвечающие за функцию распознавания символов. При запуске мастера установки, JAWS, ещё на самом первом этапе, когда пользователь слышит щелчки, начнёт загрузку данного компонента с сервера Freedom Scientific, размер которого составляет около 55 мегабайт. Поэтому если тарифный план провайдера не предоставляет безлимитный доступ в Интернет, следует учитывать эту особенность при установки JAWS 13, так как соответствующих предупреждений JAWS не выдаёт и не предлагает отложить данную операцию. В связи с этим и не стоит удивляться более затянутому начальному этапу установки JAWS, до того момента, как начинает говорить синтезатор речи.

Если по каким-то причинам подгрузка компонентов OmniPage не удалась, то после инсталляции JAWS будет выдано предупреждение о том, что удалось установить не все элементы программы.

Тем не менее, перед подключением к Интернету, мастер установки пытается обнаружить OmniPage в рабочей директории, где находится и дистрибутив самого JAWS. Поэтому можно самостоятельно скачать данный системный компонент с сервера, чтобы избавиться от необходимости каждый раз, при переустановки, загружать его из сети.

Для этого следует загрузить его по ссылкеftp://ftp.freedomscientific.com/users/hj/private/WebFiles/DynUpdate/FSOmniPage/%7B0186AAAA-2A39-48C3-AC63-E44B049658C7%7D/FSOmniPage.msi и положить в ту же директорию, где находится запускаемый базовый дистрибутив JAWS.

Во время инсталляции JAWS установщик воспользуется данным пакетом, и подключение к Интернету не понадобиться.

В JAWS поддерживается распознавание на нескольких десятках языков, а именно на азербайджанском, албанском, английском, африкаанс, баскском, белорусском, болгарском, венгерском, галисийском, голландском, греческом, датском, индонезийском, исландском, испанском, итальянском, каталанском, китайском, корейском, латвийском, литовском, македонском, малайском, немецком, норвежском, польском, португальском, румынском, русском, сербском (кириллическом и латинском), словацком, словенском, тайском, турецком, украинском, фарерском, финском, французском, хорватском, чешском, шведском, эстонском и японском.

Впрочем, для подавляющего большинства русскоговорящих пользователей вполне достаточно поддержки двух наиболее часто используемых ими языков: русского и английского, которые и присутствуют в вышеприведённом списке.

Чтобы задать язык распознавания, следует открыть центр настроек, где в основном списке веток параметров третьей снизу будет как раз "Система оптического распознавания". В ней доступно две настройки, которыми определяются основной и дополнительный языки.

Применить оптическое распознавание можно как ко всему экрану, так и к конкретному окну или даже отдельно взятому элементу. Существуют следующие клавиатурные команды для управления данной функцией:

После нажатия одной из команд распознавания, JAWS произносит слово "Запущено" (Started), после чего следует дождаться завершения процесса. Когда он будет окончен, программа произнесёт "Завершено" (Finished) и переключится на JAWS-курсор. Если же по каким-то причинам распознавание требуется прервать, то следует выполнить последнюю из вышеприведённых команд, и JAWS произнесёт "Отменено" (Canceled).

После успешного выполнения оптического распознавания, изучить его результаты можно в режиме JAWS-курсора, который включается автоматически. Результаты аннулируются тогда, когда происходит переход в другое окно или диалог, переключение на PC-курсор или же перезагрузка всего JAWS. Если одно из этих событий произошло, то оптическое распознавание потребуется повторить.

JAWS принимает к обработке текущее изображение на экране, чёткость которого может зависеть от множества факторов. Согласно официальным техническим спецификациям, технология OmniPage даёт максимально эффективные результаты распознавания при качестве картинки в 300 т/д, то есть когда линия длинной в один дюйм (2,54 см) образуется трёмястами пикселями, выстроенными вряд.

Чтобы улучшить качество изображения на экране можно попробовать выполнить следующие действия:

  1. Развернуть окно, нажав Alt+Пробел и выбрав пункт "Развернуть".
  2. Нормализовать или же увеличить, в пределах разумного, изображение на экране, что часто доступно в программе-просмоторщике в меню "вид".
  3. Увеличить разрешение экрана, так как зачастую это может повысить качество выводимой картинки.

Система оптического распознавания предназначена для повышения доступности содержимого окон, в которых текстовая информация представлена в графической форме, например, надписи на кнопках или стриминговые презентации в рамках вебенаров.

Разумеется, она может быть применена и для распознавания сканированных текстов в окне программы-просмоторщика или, при должной сноровки, даже для попытки распознавания CAPTCHA. Тем не менее, следует помнить, что это не является её основной функцией, и при подобном использовании, её эффективность будет на несколько порядков ниже, нежели у альтернативных решений по оптическому распознаванию символов, специально ориентированных на решение именно этих задач.



Распространение материалов сайта означает, что распространитель принимает условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2017
Rambler's Top100