1

Тема: Как отформатировать нумерацию списков?

Получаю документ Word из pdf файла, сбивается форматирование.
Появляются другие шрифты, сжатый шрифт, формат абзаца с пропусками до и после строки.
Приходится каждый документ тупо обрабатывать:
выделяю весь документ, Шрифт, размер, масштаб 100%, без сжатия,
Абзац, интервалы

2

Re: Как отформатировать нумерацию списков?

увы..увы...после FINEREADER
если текст гладкий(нет нижних-верхних индексов )  --сохраняю как просто текст--удаляю все оформление, все равно ему доверять нельзя
если текст сложнее --удаляю интервалы и отступы(режим форматирования)

режимы точный и редактируемый практически не применяю --там полная каша
----------
как правило все области выделяю вручную, по крайней мере контролирую), по-странично

и тяжелая это работа --из болота тащить бегемота, особенно если распознаются сканы(часто грязные и кривые),  врется даже распознавание вордовского документа, сохраненного как PDF

УВЫ...УВЫ...УВЫ
сейчас распознаю редко, глаза не позволяют

3

Re: Как отформатировать нумерацию списков?

А как вы решаете проблему текстовых надписей (когда FineReader помещает текст в элемент типа Надпись)?

Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

4

Re: Как отформатировать нумерацию списков?

Alex_Gur пишет:

А как вы решаете проблему текстовых надписей (когда FineReader помещает текст в элемент типа Надпись)?

фоновый рисунок + текстовые поля
уже в ворде создаю надписи и прицепляю к рисунку

я распознала сотни тысяч страниц, но применяла только два режима
--простой текст
--форматирование
--при явном расположении информации в виде таблицы(например рисунок+наименование) оформляла это как таблица, задавала для ячейки с рисунком формат картинки, для всех супер грязных ячеек --аналогично

почти всю правку делала в ворде, в файнридере --только размещала блоки и черновое распознавание(при плохом --уточняла причину, меняла язык, переводила в картинку)

---------------------
большинство сканов были плохие и очень плохие, так что приходилось приспосабливаться, уменьшать нагрузку на глаза
довольно часто распечатывала исходный документ на бумагу, дробила ПДФ на части по 10-20 страниц, максимальные куски =50 страниц(если читаемый текст)

были куски страниц(а иногда и целые листы), которые я вообще не смогла прочитать

5

Re: Как отформатировать нумерацию списков?

shanemac51 пишет:
Alex_Gur пишет:

А как вы решаете проблему текстовых надписей (когда FineReader помещает текст в элемент типа Надпись)?

фоновый рисунок + текстовые поля
уже в ворде создаю надписи и прицепляю к рисунку

Нет, наоборот, я имею в виду, что FR создает вордовские надписи, которые потом трудно преобразовывать в текст.
Вы использовали в FR какой-то специальный режим распознавания, при котором надписи у вас  не создавались?

Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

6

Re: Как отформатировать нумерацию списков?

я применяю только
я распознала сотни тысяч страниц, но применяла только два режима
--простой текст
--форматирование

надписей я не получаю
надписи --это точное распознавание или редактируемое(их иногда просто НЕВОЗМОЖНО привести в нормальный редактируемый вид)

и очень часто применяю таблицы(с невидимыми границами) для размещения элементов

7

Re: Как отформатировать нумерацию списков?

прилагаю пример
--его я распознаю таблицей
--текст к тому же не читаем

Post's attachments

W08.gif 58.75 Кб, файл не был скачан. 

You don't have the permssions to download the attachments of this post.

8

Re: Как отформатировать нумерацию списков?

бывали и хуже, здесь хоть часть символов читается

9

Re: Как отформатировать нумерацию списков?

а это почти отличный --все читается без напряга

10

Re: Как отформатировать нумерацию списков?

shanemac51 пишет:

а это почти отличный --все читается без напряга

Да, это еще очень даже неплохо! smile

Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

11

Re: Как отформатировать нумерацию списков?

а это почти отличный --все читается без напряга
--рисую в файнридере таблицу/таблицы
--почти все считаю картинками
--распознаю простым текстом
--в ворде мне все хорошо видно, читаемо
--забиваю картинки текстом

------------
не все так плохо --многое все же распознавалось, но области я все ставила вручную или автоматически(но контролируя)

Post's attachments

w145a.gif 70.34 Кб, файл не был скачан. 

You don't have the permssions to download the attachments of this post.

12

Re: Как отформатировать нумерацию списков?

shanemac51 пишет:

а это почти отличный --все читается без напряга
--рисую в файнридере таблицу/таблицы
--почти все считаю картинками
--распознаю простым текстом
--в ворде мне все хорошо видно, читаемо
--забиваю картинки текстом

------------
не все так плохо --многое все же распознавалось, но области я все ставила вручную или автоматически(но контролируя)

Буквы и рисунки фона, наверно, сильно мешаются...  sad

Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

13

Re: Как отформатировать нумерацию списков?

Буквы и рисунки фона, наверно, сильно мешаются...


тексты были в основном технические --это не часто требовалось сохранить

не требовалась 100% копия
--это распознавание было первым шагом перед переводом инструкции
--далее шел перевод (TRADOC)
--затем чистовое форматирование

14

Re: Как отформатировать нумерацию списков?

Интересно, как же вам удалось "научить" FR не учитывать такой фон? Как FR определяет, какие именно символы вам нужно распознать, а какие - не нужно?

Удобной и приятной работы в Word!
Перевести спасибо на Яндекс кошелёк - 41001162202962; на WebMoney - R581830807057.

15

Re: Как отформатировать нумерацию списков?

достаточно часто(особенно грязные и цветные) переводила в рисунки BMP -формата, их обрабатывала
--осветляла
--резкость
--тон
....

обрабатывать напрямую в ПДФ  так и не освоила(не очень хотела видимо)
такие страницы, что я выложила --все равно поштучно обрабатывать легче

а объединить готовые ДОС-кусочки не проблема, часто писала вспомогательные макросы(я программист по основной работе)

16

Re: Как отформатировать нумерацию списков?

конечно мой подход к распознавания может и не пригоден для распознавания красочных прейскурантом, но таких работ у меня почти не было

иногда  правда
--страницы сохранялись как картинки, они вставлялись в подложку ворда
--затем областями обводился текст для перевода в файн ридере,  игнорируя рисунки
--переводился
--надписями вставлялся в основной ворд(на те же места, где был и в оригинале)

что-то мне правда помнится, что таких случаев было 3-4 за все время , да и листов не более, чем по 10

=======
это видимо работа для inDesing  --там можно лепить перевод прямо поверх картинок
я несколько раз принималась за примеры, но на этом и остановилась --не особо требовалось

17

Re: Как отформатировать нумерацию списков?

У меня всё проще, чистый текст с нумерованными списками, нет картинок. Если я стандартными шагами могу подогнать его как нужно, значит должен быть способ автоматизировать процесс.
Я делаю так:
выделяю всё, шрифт times, размер 11; шрифт интервал обычный, масштаб 100%; далее абзац интервалы До и после=0, межстрочный одинарный, далее выставляю поля, выровнять по ширине и всё, остальное индивидуально читаю и правлю. И так кучу документов. Если бы хотя бы это макросом сделать ,это было бы здорово.
К сожалению я ни разу с макросами не сталкивался, не знаю с чего начать.
Там, у меня таблицы, конечно, при таком форматировании портятся, но это уже вторично и мелочь,пока. Там приходится по частям её выделять что бы в ячейках сделать  выравнивание слева.
Неужели, действительно ничего нельзя сделать?

18

Re: Как отформатировать нумерацию списков?

с нумерованными списками

тогда у вас только одна проблема --списки(файн ридер их нечетко распознает ---пропускает позиции)
остальное решаемо макросом

19

Re: Как отформатировать нумерацию списков?

К сожалению я ни разу с макросами не сталкивался, не знаю с чего начать.

в ворде есть макрозапись действий

выделяю всё, шрифт times, размер 11; шрифт интервал обычный, масштаб 100%; далее абзац интервалы До и после=0, межстрочный одинарный, далее выставляю поля, выровнять по ширине и всё

для таблиц --можно выделять столбцы/строки/таблицу целиком с выровнять влево(это если без ручного макроса)
если написать макрос вручную(вернее доработать/зациклить макрозапись), то можно и таблицы доработать

20

Re: Как отформатировать нумерацию списков?

не могу ответить, посылаю сообщение, отвечаю на 150 вопросов, плююсь в монитор, вытираю и выхожу из форума)))

21

Re: Как отформатировать нумерацию списков?

nik0m пишет:

не могу ответить, посылаю сообщение, отвечаю на 150 вопросов, плююсь в монитор, вытираю и выхожу из форума)))

не поняла, что вы имеете ввиду

ну есть на форуме контрольный вопрос для уменьшения авто-спама
я спокойно отвечаю, меня это не нервирует
меня нервирует, когда в нормальные темы загоняют рекламу на все случаи от а до я

22

Re: Как отформатировать нумерацию списков?

shanemac51 пишет:
nik0m пишет:

не могу ответить, посылаю сообщение, отвечаю на 150 вопросов, плююсь в монитор, вытираю и выхожу из форума)))

не поняла, что вы имеете ввиду

ну есть на форуме контрольный вопрос для уменьшения авто-спама
я спокойно отвечаю, меня это не нервирует
меня нервирует, когда в нормальные темы загоняют рекламу на все случаи от а до я

Я здесь новичок. Пытаюсь написать свой первый ответ, пока не знаю как правильно цитировать и прочее, думаю как правильнее спросить, ничего не сохранил, а он спрашивает с помощью чего набирается текст? То ли Клавиатура, то ли Компьтер, не правильный ответ вопросов больше, а он повторяет этот, я и так и так. В общем ничего не получилось и сообщение пропало и вопросы так и не кончились.
Спасибо Огромное за советы, попробую разобраться с макрозаписью,

23

Re: Как отформатировать нумерацию списков?

shanemac51
Спасибо за подсказку, разобрался с макрозаписью, записал свой макрос, открыл в редакторе, оказалось мне там всё понятно, подправил, получился мой первый макрос. Ещё раз спасибо за помощь!

24

Re: Как отформатировать нумерацию списков?

shanemac51 пишет:

с нумерованными списками

тогда у вас только одна проблема --списки(файн ридер их нечетко распознает ---пропускает позиции)
остальное решаемо макросом

Теперь очередь разобраться со списками, Вы не знаете как word воспринимает нумерацию списков? Есть ли какой нибудь общий признак по которому можно было бы выделить всю нумерацию в документе?

25

Re: Как отформатировать нумерацию списков?

nik0m пишет:

   общий признак по которому можно было бы выделить всю нумерацию в документе?

Я с ними не справилась(из-за дырок, когда список разбивается на части, т.е. какая-то позиция пропускается, ей не присваивается номер, она остается текстом)

обычно я пыталась распознать все как текст --не всегда удавалось   smile