1

Тема: Преобразование надписи в текст

Мне довольно часто приходится распознавать текст с помощью программы ABBYY FineReader 11.
При сохранении результатов распознавания в Word данная программа иногда самопроизвольно формирует объекты типа Надпись и размещает в них текст. С такими надписями очень неудобно работать - текст в них не форматируется вместе с общим текстом файла. Приходится преобразовывать надписи в текст вручную.
Однако в последний раз у меня при распознавании образовалось очень большое количество подобных надписей, и, кроме того, - какие-то неизвестные мне структуры, которые я привел в прилагаемом примере.
В связи с этим возникают следующие вопросы:
1) Как найти следующую надпись?
2) Можно ли с помощью макроса автоматизировать преобразование надписи в обычный текст?
3) Что за текстовая структура образуется при распознавании и как ее преобразовать в обычный текст?

В прилагаемом примере содержится часть распознанного файла, включающая в себя одну надпись и одну неизвестную мне текстовая струтура, о которых говорится выше.

Post's attachments

Пример распознанного файла.doc 493.5 Кб, 13 скачиваний с 2013-02-19 

You don't have the permssions to download the attachments of this post.
Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

2

Re: Преобразование надписи в текст

Кстати, все картинки попадают также внутрь объекта Надпись, и нужно достать каждую картинку из надписи.

Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

3

Re: Преобразование надписи в текст

Добрый день! Нашли ли Вы решение этой проблемы? Тоже с таким столкнулся.

4

Re: Преобразование надписи в текст

посмотрела пример --
большой кусок текста распознался как сноска
вытащила и переставила в текст

----
и много там еще лишнего(например размер страницы, отступы, колонки)

я обычно распознаю как просто текст, в крайнем случае как форматированный
точная копия и редактируемый --дают супер-много мусора