Alex_Gur пишет:А как вы решаете проблему текстовых надписей (когда FineReader помещает текст в элемент типа Надпись)?
фоновый рисунок + текстовые поля
уже в ворде создаю надписи и прицепляю к рисунку
я распознала сотни тысяч страниц, но применяла только два режима
--простой текст
--форматирование
--при явном расположении информации в виде таблицы(например рисунок+наименование) оформляла это как таблица, задавала для ячейки с рисунком формат картинки, для всех супер грязных ячеек --аналогично
почти всю правку делала в ворде, в файнридере --только размещала блоки и черновое распознавание(при плохом --уточняла причину, меняла язык, переводила в картинку)
---------------------
большинство сканов были плохие и очень плохие, так что приходилось приспосабливаться, уменьшать нагрузку на глаза
довольно часто распечатывала исходный документ на бумагу, дробила ПДФ на части по 10-20 страниц, максимальные куски =50 страниц(если читаемый текст)
были куски страниц(а иногда и целые листы), которые я вообще не смогла прочитать