<<

стр. 2
(всего 4)

СОДЕРЖАНИЕ

>>

Создатель PDF файла может ограничить доступ к своему файлу, например, защитить
его паролем, установить запрет на извлечение из него текста и графики. В этом случае
при открытии подобных файлов ABBYY FineReader будет запрашивать пароль, чтобы
обеспечить защиту авторских прав создателя файла.




39
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Передача изображений через папку
на локальном диске, в локальной сети
или на FTP сервере
(только для версии Corporate Edition)
Если в Вашей компании используются многофункциональные сетевые устройства, объе
диняющие в себе функции сканирования, печати и копирования, Вы можете настроить
FineReader так, чтобы изображения с такого устройства автоматически попадали в
FineReader.

Одним из средств достижения этой цели служит режим мониторинга заданной папки
на локальном диске, в локальной сети или на FTP сервере. В этом режиме программа
автоматически открывает все добавленные в заданную папку отсканированные изобра
жения, факсы, а также документы в формате PDF. После добавления в пакет FineReader
исходное изображение стирается.

Чтобы активировать режим просмотра папки:
? В меню Файл выберите пункт Просмотр папки…, или
? В локальном меню кнопки Сканировать выберите пункт Просмотр
папки.
При запуске режима мониторинга заданной папки меняется значок кнопки на панели
Scan&Read, открывается диалог Просмотр папки и в строке состояния отображается
значок . В случае возникновения сообщения об ошибке этот значок меняется на .
Чтобы прочесть сообщение об ошибке, дважды щелкните мышкой на значке.

Чтобы отключить режим просмотра папки:
? В меню Файл выберите пункт Отключить режим просмотра папки,
или
? На панели Scan&Read нажмите кнопку Отключить.



Добавление в пакет изображений
со сдвоенными страницами
При сканировании книг удобнее отсканировать две страницы (книжный разворот) сра
зу. При этом для повышения качества распознавания такие изображения следует разде
лить на два, чтобы каждой странице соответствовала отдельная страница пакета (ана
лиз и распознавание осуществляется для каждой страницы по отдельности, исправляет
ся перекос строк).

Для этого перед сканированием или добавлением в пакет сдвоенных страниц:
? На закладке Сканирование/Открытие (меню Сервис>Опции) отметьте
опцию Делить разворот книги.

40
Г л а в а 4 . П о л у ч е н и е и о б р а б о т к а и з о б р а ж е н и я п р о г р а м м о й Fi n e Rea d e r



В этом случае книжный разворот (сдвоенные страницы) будет представлен двумя стра
ницами пакета. Подробнее о пакете см. “Общая информация по работе с пакетом”.

Замечание: Если книжный разворот (сдвоенные страницы) был разделен на две
страницы неверно, то снимите отметку с опции Делить разворот кни
ги, заново отсканируйте или добавьте в пакет изображение с книжным
разворотом и попробуйте разделить его в диалоге Разбить изображе
ние (меню Изображение>Разбить изображение) вручную.


Добавление в пакет изображений
с визитными карточками
При вводе в компьютер информации с визитных карточек их удобнее сканировать не по
одной, а сразу по несколько штук, сколько помещается на Ваш сканер. При этом качество
распознавания будет выше (в частности, благодаря исправлению перекосов) в том случае,
когда каждая визитка попадет в пакет в виде отдельной страницы. Для этого в системе
предусмотрены средства автоматического и ручного разбиения изображений, содержа
щих расположенные в определенном порядке визитные карточки (см. “Обучение на при
мерах” программы ABBYY FineReader, раздел “ Работа с визитными карточками”).
Чтобы разбить изображение:
1. В окне Пакет выберите нужное изображение.
2. В меню Изображение выберите пункт Разбить изображение.
3. В открывшемся диалоге Разбить изображение нажмите кнопку
Разбить на визитки.

Замечания:
1. Разрезаемая страница удаляется из пакета; на её место добавляются но
вые страницы, соответствующие разрезанным частям. Подробнее о паке
те см. “Общая информация по работе с пакетом”.
2. Если изображение было разрезано на визитки неверно, то попробуйте
разрезать его вручную, воспользовавшись кнопками Добавить верти
кальный разделитель/Добавить горизонтальный разделитель.
3. Чтобы удалить все разделители, нажмите кнопку Удалить все раздели
тели.
4. Чтобы передвинуть разделители, перейдите в режим Выбора объекта
(нажмите кнопку ) и переместите разделитель.
5. Чтобы удалить разделитель, перейдите в режим Выбора объекта (на
жмите кнопку ) и переместите разделитель за пределы изображения.




41
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Нумерация страниц при добавлении в пакет
По умолчанию каждой сканируемой странице присваивается номер на единицу боль
ший номера последнего изображения в пакете.

Вы можете задать номер добавляемой страницы и вручную (например, Вам нужно со
хранить исходную нумерацию страниц или Вы сканируете стопку сортированных по
порядку страниц). Для этого:
? на закладке Сканирование/Открытие (меню Сервис>Опции) отметьте
пункт Запрашивать номер страниц при добавлении в пакет.

При сканировании стопки двусторонних сортированных по порядку страниц:
1. Отметьте пункт Запрашивать номер перед добавлением в пакет на
закладке Сканирование/Открытие (Сервис>Опции).
2. В диалоге Номер страницы укажите номер страницы, с которой начи
нается сканирование и выберите опцию Через одну в поле Нумера
ция страниц. Выберите способ нумерации страниц: по возрастанию
или по убыванию. Возрастание или убывание зависит, например, от то
го, как Вы кладете стопку в автоподатчик – находятся ли меньшие или
большие номера наверху.


Проверка и корректирование полученного
изображения
? Очистить от мусора
? Инвертировать изображение
? Повернуть или зеркально отразить изображение
? Стереть участок изображения
? Увеличить/Уменьшить масштаб изображения
? Получить информацию об изображении
? Печать изображения
? Отменить последнее действие
1. Очистить от мусора
Распознаваемое изображение может быть сильно “замусорено”, т.е. содержать много
лишних точек, возникших в результате сканирования документов среднего или плохого
качества. Точки, близко расположенные к контурам букв, могут отрицательно сказаться
на качестве распознанного текста. Чтобы уменьшить количество лишних точек, можно
воспользоваться опцией Очистить от мусора. Для этого:
? В меню Изображение выберите пункт Очистить изображение
от мусора.


42
Г л а в а 4 . П о л у ч е н и е и о б р а б о т к а и з о б р а ж е н и я п р о г р а м м о й Fi n e Rea d e r



Если Вы хотите очистить от “мусора” отдельный блок, то:
? В меню Изображение выберите пункт Очистить блок от мусора.


Внимание! Если исходный текст был очень светлым или в исходном тексте исполь
зовался очень тонкий шрифт, то применение функции Очистить изоб
ражение от мусора может привести к исчезновению точек, запятых
или тонких элементов букв, что ухудшает качество распознавания.

Замечание: Если Вы сканируете или открываете “замусоренные” изображения, то
перед добавлением в пакет таких изображений в группе Обработка
изображений на закладке Сканирование/Открытие (меню Сервис>
Опции) отметьте пункт Очистить изображение от мусора.

2. Инвертировать изображение

Некоторые сканеры инвертируют изображения при сканировании (черный цвет перево
дят в белый, а белый в черный). Чтобы получить стандартное представление документа
(черный шрифт на белом фоне):
? В меню Изображение выберите пункт Инвертировать.


Замечание: Если Вы сканируете или открываете инвертированные изображения, то
перед добавлением в пакет таких изображений в группе Обработка
изображений на закладке Сканирование/Открытие (меню Сервис>
Опции) отметьте пункт Инвертировать.

3. Повернуть или зеркально отразить изображение

При распознавании изображение должно иметь стандартную ориентацию: текст должен
читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию програм
ма при распознавании определяет и корректирует ориентацию изображения автомати
чески. Если ориентация изображения была определена ошибочно, то на закладке Скани
рование/Открытие снимите отметку с пункта Определять ориентацию страницы
(в процессе распознавания) и поверните изображение вручную.

Чтобы повернуть изображение:
или выберите в меню Изо
? на 90 градусов вправо – нажмите кнопку
бражение пункт Повернуть по часовой стрелке.
или выберите в меню Изоб
? на 90 градусов влево – нажмите кнопку
ражение пункт Повернуть против часовой стрелки.
? на 180 градусов – выберите в меню Изображение пункт Повернуть на
180 градусов.



43
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Чтобы зеркально отразить изображение относительно:
? горизонтальной прямой – выберите в меню Изображение пункт Зер
кально отразить относительно горизонтали;
? вертикальной прямой – выберите в меню Изображение пункт Зеркаль
но отразить относительно вертикали.
4. Стереть участок изображения
Если Вы хотите исключить какой–то участок текста из распознавания или у Вас на изоб
ражении имеются большие участки мусора, то Вы можете стереть такие участки. Для
этого:
(на панели в окне Изображение) и, нажав на
? Выберите инструмент
левую кнопку мыши, выделите участок изображения. который Вы хотите
удалить. Отпустите кнопку, выделенная часть изображения будет удалена.
5. Увеличить/Уменьшить масштаб изображения
На панели Изображение (в окне Изображение) выберите инструмент
?
/ и щелкните мышью на изображении. Изображение увеличит
ся/уменьшится в два раза.
? Щелкните правой кнопкой мыши на изображение и в локальном меню
выберите пункт Масштаб и нужный Вам масштаб.
6. Получить информацию об изображении
Вы можете получить следующую информацию об открытом изображении:

ширину и высоту изображения в точках; вертикальное и горизонтальное разрешение
в точках на дюйм (dpi); тип изображения.
? Щелкните правой кнопкой на изображение и в локальном меню выбери
те пункт Свойства. В открывшемся диалоге выберите закладку Изобра
жение.
7. Печать изображения
Вы можете напечатать одно изображение, открытое в окне Изображение, несколько
изображений, выделенных в окне Пакет, или все изображения. Для этого:
? В меню Файл выберите пункт Печать изображения и в открывшемся
диалоге Печать установите параметры печати (принтер, количество пе
чатаемых страниц, количество копий и т.д.)
8. Отменить последнее действие
Для отмены последнего действия на панели Стандартная нажмите кнопку
?
Отменить .




44
Г л а в а 4 . П о л у ч е н и е и о б р а б о т к а и з о б р а ж е н и я п р о г р а м м о й Fi n e Rea d e r



Совет: Для повторного выполнения последнего отмененного действия на панели
Стандартная нажмите кнопку Вернуть .



Опции хранения изображений в пакете
Приводить цветное/серое изображение к черно–белому (меню Сервис>Опции, закладка
Сканирование/Открытие)

Отметьте эту опцию при сканировании через TWAIN–диалог сканера в сером режиме
(с автоподбором яркости) или при сканировании в цвете, если при этом сканируемые
документы не содержат цветных картинок, цветного шрифта и фона или же Вам не тре
буется передача цвета в выходное изображение. В этом случае сохраняемые в пакет изо
бражения будут занимать меньше места на диске.




45
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я
Глава 5
Анализ макета страницы


Прежде чем приступить к распознаванию, программа должна
знать, какие участки изображения надо распознавать. Для это
го проводится анализ макета страницы, во время которого вы
деляются блоки с текстом, картинки, таблицы и штрих–коды.

В этой главе Вы узнаете, когда может потребоваться провести
ручной анализ макета страницы, какие типы блоков бывают,
как можно отредактировать полученные в результате автома
тического анализа блоки, а также, как можно упростить про
цесс анализа, используя шаблоны блоков.


Краткое содержание раздела:
? Общая информация по анализу макета страницы
? Типы блоков
? Опции автоматического анализа макета страницы
? Выделение и редактирование блоков вручную
? Ручной анализ таблицы
? Использование шаблонов блоков
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Общая информация по анализу
макета страницы
Анализ макета страницы может проводиться как автоматически, так и вручную. В боль
шинстве случаев FineReader сам успешно справляется с анализом сложных страниц. Ав
томатический анализ производится по кнопке 2–Распознать одновременно с распозна
ванием текста.

Замечание: Отдельная процедура анализа макета страницы тоже доступна (меню
Процесс>Анализ макета страницы). Правда, при этом качество сег
ментации может быть ниже, т.к. при совместной процедуре распознава
ния и сегментации для анализа страницы используется дополнительная
информация, полученная в процессе распознавания.

Ручное выделение блоков может понадобиться, если

1. Вы хотите распознать часть страницы;
2. в результате автоматического анализа блоки были выделены неправильно.

Совет:
? В некоторых случаях качество автоматического анализа можно улучшить,
правильно установив опции анализа макета. Проверьте установленные
опции анализа (закладка Распознавание, меню Сервис>Опции).
? В случае если программа выделила неправильно некоторые блоки, часто
оказывается быстрее исправить только их, воспользовавшись инструмен
тами для редактирования блоков, а не выделять блоки на изображении
заново вручную.


Типы блоков
Блоки – это заключенные в рамку участки изображения. Блоки выделяют для того, что
бы указать системе, какие участки отсканированной страницы надо распознавать и в ка
ком порядке. Также по ним воспроизводится исходное оформление страницы. Блоки
разных типов имеют различные цвета рамок. Вы можете изменить цвета рамок блоков
на закладке Вид диалога Опции (меню Сервис>Опции) в группе Объекты. В поле
Объект выберите нужный тип блока, а в поле Цвет – требуемый цвет.




48
Глава 5. Анализ макета страницы



При обработке изображений выделяют блоки
следующих типов:
Зона Распознавания – блок используется для распознавания и автоматического ана
лиза части изображения. После нажатия на кнопку 2–Распознать выделенный блок
автоматически анализируется и распознается.

Текст – блок используется для обозначения текста. Он должен содержать только одно
колоночный текст. Если внутри текста содержатся картинки, выделите их в отдельные
блоки.

Таблица – этот блок используется для обозначения таблиц или текста, имеющего таб
личную структуру. При распознавании программа разбивает данный блок на строки
и столбцы и формирует табличную структуру. В выходном тексте данный блок передается
таблицей.
Вы можете выделить и отредактировать таблицу вручную.

Картинка – этот блок используется для обозначения картинок. Он может содержать
картинку или любую другую часть текста, которую Вы хотите передать в распознанный
текст в качестве картинки.

Штрих–код – этот блок используется для распознавания штрих–кодов. Т.е., если Ваш
документ содержит штрих–код и Вы хотите передать его не картинкой, а перевести его
в последовательность букв и цифр, то выделите штрих–код в отдельный блок и при
свойте ему тип Штрих–код.
Замечание. По умолчанию опция, позволяющая искать и распознавать штрих–коды
отключена. Чтобы подключить ее, отметьте пункт Искать штрих–коды на закладке
Распознавание (меню Сервис>Опции).


Опции автоматического анализа
макета страницы
При автоматическом анализе макета страницы FineReader сам выделяет блоки, содержа
щие тексты, таблицы, картинки и штрих–коды.

Автоматический анализ запускается по кнопке 2–Распознать одновременно с распозна
ванием текста. До запуска распознавания необходимо установить основные опции ана
лиза: тип страницы и опции анализа таблиц.




49
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Тип страницы
Для большинства изображений расположение текста на странице определяется автома
тически, чему соответствует значение Авто на закладке Распознавание в группе Тип
страницы (меню Сервис>Опции), устанавливаемое системой по умолчанию.

В некоторых случаях может потребоваться установить значение типа страницы вруч
ную. Для этого:
? На закладке Распознавание диалога Опции (меню Сервис>Опции)
в группе Тип страницы выберите нужный Вам пункт.
Возможные типы страницы:
Автоматическое – указывает, что расположение текста на странице определяет
определение ся автоматически. Это значение устанавливается системой по
умолчанию; подходит для распознавания всех видов текстов,
в том числе многоколоночного текста, текста с таблицами и
картинками.
Одна колонка – указывает, что текст на странице напечатан в одну колонку.
Эта опция используется в случае, если автоматическое опре
деление ошибочно сегментировало страницу как многоколо
ночный текст.
Форматирован – указывает, что текст на странице расположен в одну колонку
ный пробелами и напечатан моноширинным шрифтом одного размера.
текст В распознанном тексте сохраняется деление на строки; отсту
пы от левого края передаются пробелами; каждая строка вы
деляется в отдельный абзац, и расстояния между абзацами пе
редаются пустыми строками. Используется, например, для
распознавания распечаток текстов программ.
Опции анализа таблиц
В большинстве случаев программа делит таблицу на строки и столбцы автоматически.
Дополнительная настройка опций анализа таблиц устанавливается на закладке Распоз
навание в группе Таблицы. Эти опции рекомендуется использовать, если:
? в результате автоматического анализа макета страницы таблица была вы
делена и разделена на строки и столбцы неверно;
? документ содержит много однотипных таблиц, для которых известна до
полнительная информация (например: таблица не содержит объединен
ных ячеек или таблица состоит из ячеек, текст в которых расположен
в одну строку).
1. Опция В каждой ячейке таблицы не более одной строки текста используется
для уверенного анализа таблиц с неполным количеством или без черных разделите
лей, с ячейками, содержащими не более одной строки текста.


50
Глава 5. Анализ макета страницы



Kilometers Miles – пример таблицы, в каждой ячейке которой текст
расположен в одну строку
1 0.62
5 3.2


Физ. t по – пример таблицы, ячейки которой
явление Цельсию содержат более одной строки текста
Температура 100
кипения воды
Температура 0
замерзания воды

2. Опция Таблица не содержит объединенные ячейки используется для уверенного
анализа таблиц, не содержащих объединенных ячеек.
Температура – пример таблицы с объединенной ячейкой
По Цельсию По Кельвину
273 0
100 373


Замечание: На таблицах общей структуры или на страницах с таблицами различ
ной структуры отмеченные опции В каждой ячейке таблицы не бо
лее одной строки текста и Таблица не содержит объединенных
ячеек могут привести к ошибкам анализа и соответственно снизить ка
чество распознавания.




51
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Выделение и редактирование блоков
вручную




Чтобы:
? Создать новый блок
? Отредактировать форму и расположение блоков
? Отредактировать таблицу
Чтобы создать новый блок:
1. Выберите один из инструментов:
– выделить зону распознавания;
– выделить текстовый блок;
– выделить картинку;
– выделить табличный блок.
2. Установите курсор мыши в угол предполагаемого блока. Нажмите левую
кнопку мыши и, не отпуская кнопки, потяните в противоположный по
диагонали угол.
3. Отпустите кнопку мыши.

52
Глава 5. Анализ макета страницы



Выделенная часть изображения будет заключена в рамку.

Вы можете поменять тип блока (присвоить выделенному блоку один из существующих
типов: Зона распознавания, Текст, Таблица, Картинка или Штрих–код). Для этого:
? Щелкните на блоке правой кнопкой мыши и в локальном меню выберите
Тип блока, а затем – нужный Вам пункт.
Редактирование формы и положения блоков

Чтобы передвинуть границу блока:
1. Установите курсор мыши на границу блока.
2. Нажмите левую кнопку мыши и потяните в нужную сторону.
3. Отпустите кнопку мыши.

Замечание: Если Вы установите курсор мыши на угол блока, то при движении мы
ши будут одновременно изменяться вертикальная и горизонтальная гра
ницы блока.

Чтобы добавить прямоугольную часть блока:

1. Выберите инструмент .
2. Установите курсор мыши внутри блока, к которому Вы хотите добавить
часть. Нажмите левую кнопку мыши и, не отпуская кнопки, потяните по
диагонали. Выделив нужную часть изображения, отпустите кнопку мыши.
Выделенный прямоугольник будет добавлен к блоку.
3. Если нужно, передвиньте границу блока.
Чтобы удалить прямоугольную часть блока:
1. Выберите инструмент .
2. Установите курсор мыши внутри блока, там, где Вы хотите вырезать
часть. Нажмите левую кнопку мыши и, не отпуская кнопки, потяните по
диагонали. Выделив нужную часть изображения, отпустите кнопку мыши.
Выделенный прямоугольник будет удален из блока.
3. Если нужно, передвиньте границу блока.

Замечания:
1. Вы также можете изменять границы блоков, добавляя на них новые узлы
(точки разбиения). Получившиеся отрезки можно перемещать мышью в
любом направлении.
Чтобы добавить новый узел, подведите курсор, удерживая клавишу Shift, к
нужной точке границы (курсор при этом примет форму перекрестия) и
щелкните мышью. На границе блока появится новый узел.


53
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



2. FineReader накладывает на допустимую форму блоков некоторые ограни
чения, обусловленные необходимостью передавать на распознавание не
разрывные текстовые строки. Для соблюдения этих ограничений
FineReader либо автоматически корректирует границы блока после опе
раций добавления или удаления прямоугольной части блока (например,
при удалении внутренней части блока снизу или сверху дополнительно
удаляется часть блока справа до границы блока), либо запрещает некото
рые операции по передвижению отрезков, образующих границу блока.

Чтобы выделить один или несколько блоков:

? Выберите инструмент и щелкните мышкой по нужному блоку или,
удерживая кнопку мыши, нарисуйте прямоугольник, охватывающий нуж
ные блоки.

Замечание: Вы можете выделить один или несколько блоков, используя стандарт
ные инструменты выделения блоков. Чтобы выбрать несколько блоков,
нажмите клавишу Shift или Ctrl (при этом должен быть выбран один из
инструментов: , , или ) и мышью щелкните на требуе
мых блоках. Чтобы отменить выделение уже выбранного блока или до
бавить невыделенные блоки, нажмите клавишу Ctrl (при этом должен
быть выбран один из инструментов: , , или ) и мышью
щелкните на требуемых блоках.

Чтобы передвинуть блок:

Нажмите клавишу Alt (при этом должен быть выбран один из инструмен
?
тов: , , , или ) и мышью переместите блоки.
Чтобы перенумеровать блоки:
1. Выберите инструмент .
2. Выделите блоки в том порядке, в котором Вы хотите видеть их содержи
мое в выходном тексте.

Замечание: Если Вы перенумеровываете блоки на уже распознанном изображении,
то одновременно в окне Текст в черновом режиме редактора происхо
дит перегруппировка распознанного текста в соответствии с новой ну
мерацией.




54
Глава 5. Анализ макета страницы



Чтобы удалить блок:
? Выберите инструмент и выделите блок, который Вы хотите удалить.
Выделите блоки, которые Вы хотите удалить, и нажмите клавишу DEL.
?


Внимание! Если Вы удаляете блок с уже распознанного изображения, то одновремен
но с этим в окне Текст удаляется текст, соответствующий этому блоку.

Чтобы удалить все блоки на изображении:

В меню Пакет выберите пункт Удалить блоки и текст.
?


Внимание! Если Вы удаляете блоки с уже распознанного изображения, то одновре
менно с этим в окне Текст удаляется текст, соответствующий этим блокам.


Ручной анализ таблицы

Совет: Если в результате автоматического анализа таблицы разделение на строки и
столбцы произошло неверно, прежде чем анализировать таблицу вручную зано
во, попробуйте сначала отредактировать результаты автоматического анализа.

Чтобы отредактировать таблицу вручную:

Отредактируйте таблицу, используя инструменты (панель в окне Изображение):
– Добавить вертикальную линию.
– Добавить горизонтальную линию.
– Удалить линию.

Если ячейка таблицы содержит только картинку, в диалоге Свойства блока (меню
Вид>Свойства) отметьте пункт Считать ячейку картинкой. Если же, помимо кар
тинки, в ячейке содержится некоторый текст, то выделите картинку в отдельный блок
внутри ячейки.
Чтобы объединить ячейки или строки таблицы:
в меню Правка выберите пункты Объединить ячейки таблицы или
?
Объединить строки таблицы. При объединении строк таблицы деле
ние на столбцы остается.

Объединенные ячейки можно снова разделить, воспользовавшись командой Разбить
ячейки таблицы (меню Правка).


55
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Замечание: Чтобы повторно не рисовать вертикальные и горизонтальные линии в
таблице, выделите таблицу в отдельный блок и щелкните правой кноп
кой мыши на блоке. В локальном меню выберите пункт Анализ струк
туры таблицы. А затем, используя инструменты по работе с таблицей,
отредактируйте полученные результаты.


Использование шаблонов блоков
При работе с документами с одинаковым расположением текста и картинок, такими, на
пример, как формы, бланки и т.п., вместо того чтобы анализировать макет каждой стра
ницы, Вы можете провести анализ одной из них, сохранить расположение блоков на
этой странице в файл, а затем, когда потребуется, “спроецировать” эти блоки на изобра
жение (или группу изображений) со сходным расположением текста.

Замечание: Созданный шаблон блоков можно использовать только для документов,
отсканированных с тем же разрешением, что и документ, на котором
данный шаблон блоков создавался.

Чтобы создать шаблон блоков:

1. Откройте изображение и выделите на нем блоки автоматически или
вручную.
2. В меню Изображение выберите пункт Сохранить блоки... В открыв
шемся диалоге укажите имя для шаблона блоков.
Чтобы наложить шаблон блоков:
1. В окне Пакет выделите страницы, на которые Вы хотите наложить суще
ствующий шаблон.
2. В меню Изображение выберите пункт Наложить блоки. В открыв
шемся диалоге Открыть файл с блоками выберите файл (*.blk) с нуж
ным Вам расположением блоков.
3. В диалоге Открыть файл с блоками в группе Применить к установите
переключатель в одно из положений: Всем страницам (если Вы хотите
наложить шаблон на все страницы пакета) или Выделенным страни
цам (если Вы хотите наложить шаблон только на выделенные страницы).
4. Нажмите кнопку Открыть (Open).




56
Глава 6
Распознавание


Задача распознавания состоит в том, чтобы преобразовать
отсканированное изображение в текст, сохранив при этом
оформление страницы. Прежде чем приступить к распозна
ванию текста, необходимо установить основные параметры
распознавания: язык распознавания, тип печати распознан
ного текста и тип страницы. В этой главе описываются эти
и другие параметры распознавания и приводятся ситуации,
в которых они используются.


Краткое содержание раздела:
? Общая информация по распознаванию
? Язык распознавания
? Тип печати входного текста
? Другие опции распознавания
? Распознавание в фоновом режиме
? Распознавание с обучением
? Обучение эталона
? Редактирование эталона
? Пользовательские языки и группы языков
? Создание нового языка
? Создание новой группы языков
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Общая информация по распознаванию
Внимание! Перед запуском распознавания проверьте установленные опции: язык
распознавания, тип печати распознаваемого текста и тип страницы.

Вы можете:

1. Распознать блок или несколько блоков, выделенных на изображении.
2. Распознать открытую страницу или все страницы, выделенные в окне
Пакет.
3. Распознать все нераспознанные страницы пакета.
4. Распознать все страницы в фоновом режиме. В этом режиме возможно
распознавание с одновременным редактированием уже распознанных
страниц.
5. Распознать страницы в режиме распознавание с обучением. Данный ре
жим применяется в основном для распознавания текстов, использующих
декоративные шрифты, или для распознавания большого объема (более
100 страниц) документов плохого качества печати.
6. Распознать страницы одного пакета на нескольких компьютерах одно
временно.
Чтобы запустить распознавание:
Нажмите кнопку 2–Распознать на панели Scan&Read.
?
В меню Процесс выберите нужный Вам пункт:
?


Распознать – чтобы распознать открытую страницу или все страницы, выделенные
в окне Пакет;

Распознать все – чтобы распознать все нераспознанные страницы пакета;

Распознать Блок – чтобы распознать блок или несколько блоков, выделенные
на изображении;

Запустить фоновое распознавание – чтобы запустить распознавание в фоновом
режиме.
Кнопка 2–Распознать запускает распознавание открытого изображе
ния. Чтобы изменить режим кнопки, нажмите на стрелку справа от
нее и из открывшегося меню выберите нужный пункт.


Замечание: При распознавании уже распознанной страницы перераспознаются
только отредактированные и добавленные блоки.


58
Глава 6. Распознавание



Язык распознавания
FineReader поддерживает распознавание как одноязычных, так и многоязычных (напри
мер, английско–французских) документов. При распознавании текстов на английском
или немецком языках Вы можете воспользоваться одноименными языками с медицин
скими и юридическими словарями. Данные языки, помимо тематических словарей,
включают в себя также и обычные словари FineReader.
Чтобы указать язык распознаваемого текста:
Выберите соответствующую строку в списке на панели Распознавание.
?




Если Вы хотите распознать документ, написанный на нескольких языках:
1. В списке языков на панели Стандартная выберите пункт Выбор
нескольких языков…
2. В открывшемся диалоге Язык распознаваемого текста укажите
несколько языков. Для этого:
? отметьте пункты с соответствующими названиями языков.


Совет: Если Вы часто используете какую–либо комбинацию языков, то создайте но
вую группу, содержащую эти языки.

Внимание!
1. Увеличение количества подключенных к распознаванию одного доку
мента языков может привести к ухудшению качества распознавания. Не
рекомендуется подключать более 2–3 языков.
2. Перед запуском распознавания проверьте подключенные на закладке
Форматирование шрифты: они должны содержать все символы языка
распознавания. В противном случае распознанный текст будет непра
вильно отображен в окне Текст (в словах на месте некоторых букв стоят
значки “?” или “?”).




59
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Если нужного языка нет в списке, возможны следующие варианты:
1. Данный язык не поддерживается системой FineReader. Полный список
языков приведен в разделе “Поддерживаемые языки распознавания”
справки программы ABBYY FineReader.
2. Язык исключен из списка языков показываемых на панели Стандартная.
В этом случае в списке языков на панели Стандартная выберите пункт
Выбор из полного списка языков и в открывшемся диалоге Язык
распознаваемого текста укажите необходимый язык.
3. Язык был отключен при выборочной установке. Чтобы доустановить языки
распознавания, запустите программу инсталляции FineReader в режиме по
компонентной установки (Установка дистрибутива по выбору), сни
мите отметки со всех пунктов, кроме Языки распознавания, и нажмите
кнопку Состав. В открывшемся списке языков укажите требуемые языки.

Замечание: При установке проверьте, что Вы указали ту же папку, в которую Вы
ранее установили ABBYY FineReader.

Чтобы подключить/отключить язык к списку показывае
мых языков:
В диалоге Редактор языков (меню Сервис>Редактор языков) выберите язык, который
Вы хотите подключить/отключить, и отметьте пункт (снимите отметку) Показывать
в списке языков.

Совет: Вы можете установить язык распознавания на отдельный блок. Для этого щелк
ните правой кнопкой мыши на блоке, для которого вы хотите установить язык
распознавания, отличный от языка распознавания для всего текста, и из ло
кального меню выберите пункт Свойства. В открывшемся диалоге Свойства
на закладке Блок в поле Язык распознавания выберите язык распознавания
выделенного блока.


Тип печати входного текста
Для большинства текстов тип печати определяется автоматически. Этому соответствует
значение Авто (группа Тип печати, меню Сервис>Опции, закладка Распознавание).

При распознавании текстов, напечатанных на матричном принтере в черновом режиме
или на пишущей машинке, можно добиться более высокого качества распознавания, ус
тановив правильный Тип печати:




60
Глава 6. Распознавание



для текстов, напечатанных на пишущей машинке – значение Пишущая
?
машинка;
для текстов, напечатанных на матричном принтере – значение Матрич
?
ный принтер.

Фрагмент страницы, напечатанной на матричном прин
тере в черновом режиме. На картинке видно, что штри
хи букв состоят из отдельно стоящих точек.

Фрагмент страницы, напечатанной на пишущей машин
ке. Ширина букв одинакова (сравните, например, буквы
“w” и “t”).

Чтобы поменять тип печати:
? На закладке Распознавание диалога Опции (меню Сервис>Опции)
в группе Тип печати выберите требуемый пункт.

Замечание: После распознавания текстов, напечатанных на пишущей машинке или
матричном принтере, не забудьте снова выбрать значение Авто при
возвращении к типографскому тексту.


Другие опции распознавания
Показывать или не показывать изображение
при распознавании

Распознавание группы страниц происходит быстрее, если обрабатываемое изображение
не показывается.
? На закладке Опции (меню Сервис>Опции, диалог Опции) снимите
отметку с пункта Показывать изображение при распознавании.

Указать ориентацию текста
Если программа некорректно распознала блоки с вертикальным направлением текста
(текстовый блок, ячейки таблицы):
? Щелкните правой кнопкой мыши по блоку с вертикальным направлени
ем текста и в локальном меню выберите пункт Свойства. В открывшемся
диалоге Свойства выберите нужный вариант в списке Направление тек
ста и распознайте изображение заново.




61
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Указать, что текст в блоке является инвертированным
или отраженным
Если программа некорректно распознала блоки с инвертированным или отраженным
текстом (текстовый блок, ячейка таблицы или вся таблица), то:
? Щелкните правой кнопкой мыши на нужном блоке и в локальном меню
выберите пункт Свойства. В открывшемся диалоге Свойства отметьте
пункт Инвертированный или Отраженный соответственно и распоз
найте изображение заново.


Распознавание в фоновом режиме
Если Вы хотите одновременно с распознаванием редактировать распознанные страни
цы, Вы можете запустить распознавание в фоновом режиме:
? В меню Процесс выберите пункт Запустить фоновое распознавание.
В строке состояния внизу экрана появится значок . Если для окна
Пакет выбран режим показа свойства страниц (локальное меню, пункт
Вид>Вид со свойствами), то напротив распознаваемой страницы в ко
лонке Открыта появится значок .

В этом режиме распознавание автоматически возобновляется, как только в пакете появ
ляются нераспознанные страницы.

Замечание: На многопроцессорных компьютерах режим “Фоновое распознавание”
позволяет увеличить скорость распознавания пакетов, содержащих
большое количество страниц.

Чтобы остановить Распознавание в фоновом режиме:
? В меню Процесс выберите пункт Остановить фоновое распознавание.


Внимание! В режиме работы Распознавание в фоновом режиме используются
опции, установленные в программе до запуска фонового распознавания.


Распознавание с обучением
Как было отмечено, программа FineReader позволяет вводить тексты разного качества,
напечатанные практически любыми шрифтами. Тексты хорошего и среднего качества,
а также шрифты обычного начертания распознаются без предварительного обучения.

Режим “Распознавание с обучением” используется для:




62
Глава 6. Распознавание



1. распознавания текстов, использующих декоративные шрифты;
2. распознавания текстов, в которых встречаются специальные символы
(например, отдельные математические символы);
3. распознавания большого объема (более 100 страниц) текста плохого
качества.

В других случаях Распознавание с обучением использовать не рекомендуется, т.к.
затраты на обучение будут больше, чем полученный выигрыш в качестве распознавания.

Обучение проводится при распознавании одной–двух страниц текста в специальном ре
жиме. В результате создается эталон букв, встречающихся в тексте. Этот эталон в даль
нейшем используется при распознавании основного объема текста. Некоторые пары
или тройки символов в тексте могут склеиваться. Если при обучении Вам не удается пе
реместить описывающий прямоугольник так, чтобы он заключал в себя один целый
символ и не содержал при этом части соседних, то Вы можете обучить программу соче
танию символов, которые невозможно “расклеить”. Такие неразделяемые сочетания двух
или трех символов называются лигатурами. Это, например, такие сочетания, как ед, от, ff,
ffi, ffl и другие.

Внимание!
1. Созданный эталон можно использовать только для распознавания текс
тов, использующих тот же шрифт и размер шрифта и отсканированных
с тем же разрешением, что и документ, на котором данный эталон созда
вался.
2. При удалении пакета эталон также удаляется.
Вы можете сохранить созданный эталон для работы с другими пакетами.
Для этого сохраните настройки пакета в формате шаблон пакета (*.fbt).
3. При переходе к распознаванию текстов, напечатанных другим шрифтом,
не забудьте отключить эталон (на закладке Распознавание, меню Сер
вис>Опции установите переключатель в положение Не использовать
пользовательский эталон).

Последовательность действий при распознавании
с обучением:
1. Установите режим Распознавание с обучением (на закладке Рас
познавание, меню Сервис>Опции в группе Распознавание с обу
чением установите переключатель в положение Распознавание с
обучением). В строке состояния появится название эталона (по умол
чанию default).
2. Нажмите кнопку 2–Распознать.
3. Обучите эталон, распознав одну–две страницы в режиме распознавание
с обучением.

63
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Обучаемые символы заносятся в эталон, создаваемый системой по умол
чанию. По окончании обучения система сохранит созданный эталон
(default.ptn) в папке, где хранится пакет.
4. Отредактируйте эталон.
5. Отмените режим Распознавание с обучением (на закладке Распозна
вание в группе Обучение установите переключатель Распознавание с
пользовательским эталоном).
6. Запустите распознавание основного текста, нажав на кнопку 2–Распоз
нать.

Замечания:
1. Чтобы создать несколько эталонов на один пакет, воспользуйтесь диало
гом Редактор эталонов (вызывается с закладки Распознавание по кноп
ке Эталоны или из меню Сервис>Редактор эталонов). Создайте но
вый эталон (нажмите в диалоге на кнопку Новый) и выберите его для
работы (нажмите на кнопку Выбрать). Далее работа с созданным этало
ном происходит так же, как и работа с default–эталоном, см. выше пп 1–5.
2. Если в процессе обучения было создано несколько эталонов, то подклю
чается последний созданный эталон. Название подключенного эталона
пишется в строке состояния.
Чтобы подключить другой эталон для распознавания, в диалоге Редактор
эталонов (меню Сервис>Редактор эталонов) в списке эталонов выбе
рите эталон и нажмите кнопку Выбрать. На закладке Распознавание в
группе Обучение установите переключатель в положение Распознава
ние с пользовательским эталоном.
3. Если на закладке Распознавание отмечена опция Использовать встро
енные эталоны, то в режиме Распознавание с обучением программа
предложит обучить только неуверенно распознанные символы.

Если Вы обучаете программу декоративным или нестандартным шрифтам (например,
тибетскому) и при этом используете встроенные эталоны, программа может распознать
часть символов неправильно, не предложив их обучить. В этом случае рекомендуется
снять отметку с опции Использовать встроенные эталоны: обучение будет произво
диться каждому символу.


Обучение эталона
1. Проверьте, чтобы на закладке Распознавание (меню Сервис>Опции)
в группе Распознавание с обучением переключатель был установлен в по
ложение Распознавание с обучением.
2. Нажмите кнопку 2–Распознать. Программа начнет распознавание. Как
только встретится символ, подлежащий обучению, откроется диалог Руч
ное обучение эталона с изображением этого символа.

64
Глава 6. Распознавание




Обучение символу
Описывающий прямоугольник в верхней части диалога должен содержать один целый
символ. Если он содержит часть буквы или более одной буквы, то с помощью мыши
или кнопок и прямоугольник можно передвинуть так, чтобы он охватывал
одну целую букву.

Далее введите нужный символ и нажмите кнопку Обучить.

Внимание!
1. Обучать можно только символам, входящим в алфавит языка.
Если Вы обучаете программу символам, которые нельзя ввести с клавиа
туры, то для их обозначения можно использовать комбинацию из двух
символов или Вы можете скопировать требуемый символ из Таблицы
символов (открывается при нажатии в диалоге Ручное обучение эта
лона кнопки ).
2. Если в обучаемом тексте встречаются слова, набранные курсивом или полу
жирным, и Вам важно сохранить гарнитуру шрифта в распознанном текс
те, то при обучении таким символам в диалоге Ручное обучение эталона
следует отметить пункты Курсив или Полужирный соответственно.
3. При обучении следите за тем, чтобы изображениям заглавных букв соот
ветствовали заглавные буквы, а изображениям строчных букв – строчные.




65
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Если при обучении Вы ошиблись, то можно нажать кнопку Вернуться, и охватывающий
прямоугольник вернется на предыдущую позицию, а последняя обученная пара “изобра
жение – символ” будет удалена из эталона. Кнопка Вернуться действует в пределах од
ного слова.
Обучение лигатурам
Лигатуры – это сочетания двух или трех символов, которые из–за особенностей их на
чертания невозможно разделить при обучении и которым поэтому сразу обучаются как
комбинации символов. Обучение лигатурам происходит так же, как и обучение отдель
ным символам:
1. В строке для ввода символа введите нужное сочетание символов и на
жмите кнопку Обучить.
2. Описывающий прямоугольник в верхней части диалога должен содер
жать сочетание целиком. Передвинуть прямоугольник можно с помо
щью мыши или используя кнопки и .
В одном эталоне может содержаться до 1000 новых символов. Однако не следует созда
вать слишком много лигатур, т.к. это может отрицательно сказаться на качестве распоз
навания.
При обучении необходимо учесть следующие ограничения:
1. Изображения некоторых символов не различаются системой распознава
ния и сопоставляются с каким–то одним символом. Например, прямой
('), левый (‘) и правый (’) апострофы хранятся в эталоне как изображение
прямого апострофа. Таким образом, в результате распознавания в тексте
никогда не появится правый или левый апостроф, хотя при обучении Вы
указывали именно эти символы.
2. Для некоторых изображений решение о том, какому символу в распо
знанном тексте сопоставить встретившееся конкретное изображение,
принимается на основе общего анализа распознанного текста. Так, на
пример, решение о том, является ли символ, обозначаемый “кружком”,
буквой о или цифрой ноль, система принимает в зависимости от того,
находятся ли рядом другие цифры или буквы.


Редактирование эталона
Прежде чем запускать распознавание с только что созданным эталоном, рекомендует
ся просмотреть эталон и, если потребуется, отредактировать. Этим Вы сведете к мини
муму ошибки распознавания, которые могут возникнуть из–за неправильно обученно
го эталона.

Эталон должен содержать только целые символы или лигатуры. Символы, обрезанные
с краев, и символы с неправильными подписями следует удалить из эталона.


66
Глава 6. Распознавание



Чтобы отредактировать эталон:
1. В меню Сервис выберите пункт Редактор эталонов...
2. В открывшемся диалоге Редактор эталонов выберите нужный эталон и
нажмите кнопку Редактировать... Перед Вами откроется диалог Симво
лы пользовательского эталона.
3. Выбрав символ, нажмите кнопку Свойства, чтобы отредактировать под
пись и указать правильное начертание: курсив, полужирный, верхний
или нижний индексы, или нажмите кнопку Удалить, чтобы удалить не
правильно обученные символы.


Пользовательские языки и группы языков
Вы можете использовать не только предопределенные языки и группы языков, но и со
здать новый язык или объединить существующие языки в новую группу и при распозна
вании подключить именно их.
Когда надо создавать новый язык:
1. Для подключения пользовательского словаря.
Например, необходимо распознать русский текст, содержащий аббревиа
туры. Вы можете создать словарь аббревиатур и подключить его к поль
зовательскому языку. На основе русского языка с подключенным систем
ным словарем и языка, созданного Вами с подключенным словарем аб
бревиатур, Вы можете создать группу для дальнейшего ее использования
при распознавании Ваших текстов.
2. Для распознавания документов специального вида.
Например:
? Страница содержит перечень артикулов, состоящий из цифр и
нескольких букв. Вы можете создать новый язык, включив в него
минимально необходимый набор символов, и использовать его
для распознавания данного типа документов.
? Документ использует только заглавные буквы английского языка.
В этом случае для повышения качества распознавания следует ис
ключить из распознавания символы, которые заведомо не могут
встретиться в тексте, в данном случае – все строчные буквы.
Когда надо создавать группу языков:
? Если Вы часто используете какую–нибудь комбинацию языков.

Создать язык или группу языков можно из диалога Редактор языков (меню Сервис,
пункт Редактор языков).




67
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Создание нового языка
Чтобы создать новый язык распознавания:

1. В меню Сервис выберите пункт Редактор языков...
2. Нажмите кнопку Новый. В открывшемся диалоге установите переключа
тель в положение Создать новый язык на основе существующего и
выберите язык, на основе которого Вы создаете новый.
3. Перед Вами откроется диалог Свойства языка.




При создании нового языка нужно определить следующие
параметры (все параметры задаются в диалоге Свойства
языка):

1. Имя нового языка.
2. В поле Алфавит языка указан алфавит языка, на основе которого Вы
создаете новый язык. Если требуется, отредактируйте алфавит, нажав на
кнопку .
3. Словарь, который будет использоваться системой при распознавании
и проверке распознанного текста. Возможны следующие варианты:
? Нет (не подключать словарь к языку).
? Встроенный словарь (используется словарь, поставляемый
с программой).
? Пользовательский словарь.




68
Глава 6. Распознавание



Чтобы наполнить словарь или подключить старый пользовательский словарь или текс
товый файл в Windows (ANSI)–кодировке (слова должны быть разделены пробелами или
другими символам, не включенными в алфавит), нажмите кнопку Редактировать.

Замечание: Словарные слова пользовательского языка считаются правильными, ес
ли в тексте они встретились с той капитализацией, в которой они зада
ны в словаре, а также в каком–либо стандартном виде: всеми маленьки
ми, всеми большими буквами или с большой буквы:
Вид слова в словаре: Допустимые варианты написания
слова в тексте:

abc abc, Abc, ABC

Abc abc, Abc, ABC

ABC abc, Abc, ABC

aBc aBc, abc, Abc, ABC

Регулярное выражение (задается грамматика нового языка; подробнее
?
о регулярных выражениях см. Регулярные выражения).

Замечания:
1. Нажав в диалоге Свойства языков на кнопку Дополнительно, Вы мо
жете указать дополнительные свойства нового языка, например, игнори
руемые внутри слова символы или исключенные из распознавания сим
волы и т.д.
2. По умолчанию пользовательский язык будет сохранен в папку пакета.
Версия ABBYY FineReader Corporate Editoin позволяет указать другую пап
ку. Более подробно о колективной работе с пользовательскими языками
и словарями к ним см. раздел “Коллективная работа с пользовательскими
языками и пользовательскими словарями”.


Создание новой группы языков
Если при распознавании текстов Вы часто используете некоторое сочетание языков, то
Вы можете создать группу, в которую объединены эти языки. Созданная группа появится
в списке языков на панели Стандартная.

Замечание: Вы можете указать комбинацию языков непосредственно в списке язы
ков на панели Стандартная. Для этого выберите в списке строку Вы
бор нескольких языков. В открывшемся диалоге Язык распознавае
мого текста отметьте необходимые языки.

69
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Чтобы создать группу языков для распознавания:
1. В меню Сервис выберите пункт Редактор языков... и нажмите на
кнопку Новый. В открывшемся диалоге выберите пункт Создать новую
группу.
2. Перед Вами откроется диалог Свойства группы языков.




Что нужно определить для новой группы языков
(все параметры задаются в диалоге Свойства группы):
1. Имя группы.
2. Подключенные языки.

Замечания:
1. Вы можете указать символы, которые заведомо не встречаются в распоз
наваемом документе. Указание таких символов может существенно увели
чить скорость и надежность распознавания. Для этого в диалоге Свойст
ва группы языков нажмите кнопку Дополнительно и в диалоге Допол
нительные свойства группы языков отметьте соответствующие символы.
2. По умолчанию пользовательская группа языков будет сохранена в папку
пакета. Версия ABBYY FineReader Corporate Editoin позволяет указать дру
гую папку. Более подробно о колективной работе с пользовательскими
языками и словарями к ним см. раздел “Коллективная работа с пользова
тельскими языками и пользовательскими словарями”.




70
Глава 7
Проверка и редактирование
текста


После завершения распознавания результат появляется в ок
не Текст. Окно Текст – это встроенный редактор програм
мы FineReader; в нем Вы можете проверить результаты рас
познавания и отредактировать распознанный текст.

Одна из возможностей текстового редактора FineReader –
это встроенная проверка орфографии (список языков, для
которых поддерживается проверка орфографии, приведен в
разделе “Поддерживаемые языки распознавания”).

Система встроенной проверки орфографии позволяет:
1. Находить неуверенно распознанные слова (слова, в ко
торых есть неуверенно распознанные символы).
2. Находить орфографические ошибки (неправильно на
писанные слова).
3. Добавлять неизвестные системе FineReader слова в сло
варь для того, чтобы они распознавались уверенно.


Краткое содержание раздела:
? Проверка распознанного текста
? Опции проверки и редактирования текста
? Пополнение и удаление слов из пользовательского словаря
? Редактирование текста в редакторе FineReader
? Редактирование таблиц
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я


Проверка распознанного текста
Неуверенно распознанные символы и слова, которых нет в словаре, выделяются различ
ными цветами. По умолчанию для выделения неуверенно распознанных символов ис
пользуется голубой, для несловарных слов – розовый. Чтобы изменить цвета:
? На закладке Вид (меню Сервис>Опции) в поле Объект выберите пункт
Неуверенно распознанный символ (Несловарное слово) и в поле
Цвет – цвет подсветки.
Чтобы проверить результаты распознавания:
1. Нажмите кнопку 3–Проверить на панели Scan&Read
(или выберите пункт Проверка в меню Сервис).
2. Откроется диалог Проверка.




3. В диалоге Проверка три окна. Верхнее окно – аналог окна “Крупный план” программы
FineReader, в нем показано изображение слова с возможной ошибкой. Среднее окно по
казывает само слово с возможной ошибкой, в строке над этим окном выводится назва
ние типа ошибки. В нижнем окне, Варианты, предлагаются варианты замены данного
слова (если таковые имеются). Для вариантов используется словарь, указанный в поле
Язык словаря. Вы можете использовать любой словарь из предложенного списка.

Замечание: Для удобства проверки и редактирования текста диалог Проверка мо
жет быть увеличен. Для этого достаточно поместить указатель мыши на
границу диалога (указатель превратится в двустороннюю стрелку). Пе
ретаскивая границу, увеличьте или уменьшите размеры диалога.


72
Глава 7. Проверка и редактирование текста



4. У Вас есть следующие возможности:
? Нажмите кнопку Пропустить, чтобы оставить слово, как есть.
? Нажмите кнопку Пропустить все, чтобы оставить все такие слова в рас
познанном тексте, как есть.
Замечание. При нажатии на кнопки Пропустить или Пропустить все
со слова снимается “признак неуверенности” – считается, что слово не
содержит нераспознанных или неуверенно распознанных символов; сни
мается также и визуальная подсветка таких символов в тексте. При экс
порте в PDF в режиме Заменять неуверенно распознанные слова их
изображениями слова, с которых при проверки был снят “признак не
уверенности” (при нажатии кнопок Пропустить и Пропустить все), не
будут заменены на свои изображения.
? Выберите вариант для замены и нажмите кнопку Заменить или Заме
нить все, чтобы заменить текущее слово или все такие слова в тексте. Ес
ли в окне Варианты нет правильного варианта для замены слова, отре
дактируйте слово или несколько соседних слов в среднем окне (обратите
внимание, что при переходе в режим редактирования меняется назначе
ние некоторых кнопок диалога и соответственно – надписи на них) и
нажмите кнопку Подтвердить, чтобы зафиксировать сделанные измене
ния и перейти к следующему фрагменту текста.
? Нажмите Добавить..., чтобы добавить слово в словарь. В этом случае
при дальнейшей проверке орфографии, если это слово (или одна из его
форм) встретится в тексте, оно не будет считаться ошибочным.
? Нажмите Опции..., чтобы установить опции проверки распознанного
текста.
? Нажмите Закрыть, чтобы закрыть диалоговое окно.

Перемещение по неуверенно распознанным словам
Для более быстрой проверки результатов распознавания Вы можете воспользоваться
кнопками или для перемещения к следующему или, соответственно, предыду
щему неуверенно распознанному слову.

Также для перемещения по неуверенно распознанным словам можно использовать горя
чие клавиши: F4 (Shift F4).


Опции проверки и редактирования текста

Устанавливаются на закладке Проверка (меню Сервис>Опции).
? Уровень выделения ошибок


Внимание! Устанавливается до запуска распознавания.


73
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



? Останавливаться на неуверенно распознанных словах
? Останавливаться на несловарных словах
? Останавливаться на сложных словах
? Пропускать слова с цифрами и другими неалфавитными символами
? Корректировать пробелы до и после знаков препинания
Уровень выделения ошибок
В списке Уровень выделения ошибок возможно выбрать следующие значения:
? Нет – ошибки распознавания не выделяются.
? Стандартный – цветом выделяются нераспознанные и неуверенно рас
познанные символы.
? Максимальный – помимо нераспознанных и неуверенно распознан
ных символов, цветом выделяются слова, которых нет в словаре языка
распознавания.

Замечание: Количество показываемых в окне Текст ошибок будет изменено после
повторного распознавания документа.

Останавливаться на неуверенно распознанных словах

Система при проверке орфографии останавливается на словах, в которых были неуве
ренно распознаны какие–либо буквы.
Останавливаться на несловарных словах
Эта опция позволит Вам проверить слова, которых нет в словаре и которые могли быть
распознаны программой неверно.
Останавливаться на сложных словах
При проверке орфографии система останавливается на словах, которых нет в словаре,
но которые могут быть построены по имеющимся морфологическим моделям или кото
рые могут быть составлены из имеющихся в словаре слов.
Игнорировать слова с цифрами и другими
неалфавитными символами
При проверке орфографии слова, внутри которых встречаются цифры или какие–либо
другие символы, не входящие в алфавит языка распознавания, не считаются ошибочны
ми, если эти слова не содержат неуверенно распознанные символы.
Корректировать пробелы до и после знаков препинания
Если этот пункт отмечен, то система не будет останавливаться на тех фрагментах, где
неверно расставлены пробелы до и после знаков препинания, а исправит их автома
тически.


74
Глава 7. Проверка и редактирование текста


Пополнение и удаление слов
из пользовательского словаря
Добавление слова в пользовательский словарь
Добавление слов в словарь – один из способов повышения качества распознавания, т.к. при
распознавании система проверяет слова по словарю. В словарь имеет смысл добавлять час
то встречающиеся слова (например, термины, сокращения, названия и т.д.). При добавле
нии слова система строит его парадигму (совокупность всех форм данного слова). Благода
ря этому система может уверенно распознавать не только ту форму, которая уже однажды
встретилась в тексте и была добавлена в словарь, но и все формы добавленного слова.

Чтобы добавить слово в словарь во время проверки орфографии:
? Нажмите кнопку Добавить в диалоге Проверка.


В диалоге Начальная форма Вы должны установить следующие параметры:
1. Часть речи (Существительное, Прилагательное, Глагол, Неизменяемое
слово).
2. Если слово всегда пишется с большой буквы, отметьте пункт Имя собст
венное.
Если Вы добавляете слово, являющееся сокращением, отметьте пункт Аб
бревиатура.
3. Начальная форма слова.
Нажмите ОК. Откроется диалог Построение парадигмы, в котором пользователю
предлагаются вопросы, по ответам на которые строится парадигма слова. Для ответов на
вопросы нажимайте кнопки Да или Нет. Если вы ошиблись при ответе на вопрос, на
жмите кнопку Сначала, чтобы иметь возможность ответить на этот вопрос по–другому.
Система покажет построенную парадигму в диалоге Парадигма.

Замечания:
1. Если Вы хотите, чтобы при добавлении слова в английский словарь пара
дигма не строилась (слово добавлялось бы как неизменяемое), то на за
кладке Проверка (меню Сервис>Опции) отметьте опцию Добавлять
слово как неизменяемое.
2. Вы можете добавлять слова во время просмотра списка добавленных
слов. Для этого в меню Сервис выберите пункт Просмотр словарей. В
открывшемся диалоге Выбор словаря выберите язык и нажмите кнопку
Просмотр. Откроется словарь со списком добавленных слов. Вы можете,
нажав на кнопку Добавить, добавить набранное слово.
3. Построение парадигмы при добавлении слова в словарь возможно для
английского, армянского (восточный, западный и грабар), испанского,
итальянского, немецкого (новая и старая орфография), русского, украин
ского и французского языков.


75
A B BY Y Fi n e Re a d e r 7 . 0 Р у к о в о д с т в о п о л ь з о в а т е л я



Если добавляемое слово уже есть в словаре, система предупредит Вас об этом. В этом
случае Вы можете посмотреть его парадигму. Если существующая парадигма Вас не уст
раивает, можете создать другую (кнопка Добавить в диалоге Добавить слово).

Совет:

<<

стр. 2
(всего 4)

СОДЕРЖАНИЕ

>>