1

Тема: Удаление лишних концов абзацев

Добрый день!

Есть задача удалить

2

Re: Удаление лишних концов абзацев

Что-то пошло не так. Отправились только три первых слова из сообщения. При этом редактировать сообщение или удалить я не могу. Странно. Пишу еще раз.

Есть задача удалить лишнее в конце абзацев (после распознавания в FineReader). Что пришло в голову: найти и заменить "знак конца абзаца + следующую за ним строчную букву". Проблема в том, что в режиме подстановочных знаков Word не позволяет искать концы абзацев. Кроме того, почему-то при поиске [а-я] ищет не только строчные, но и прописные буквы.  В общем, вариантные сработал.

Макросы с определением абзацев по наличию точки в конце не подходят, потому что тогда сольются все списки, где точек в конце строки часто нет.

Может быть, у кого-то есть другое решение?
Хэлп и сэнкс!

3

Re: Удаление лишних концов абзацев

Да что такое ! )

Первая фраза: "Есть задача удалить лишнИЕ концЫ абзацев".

4

Re: Удаление лишних концов абзацев

найти и заменить "знак конца абзаца + следующую за ним строчную букву".

я это делаю, прогоняя 33 раза запрос на замену ^p+русскаяБуква, но с учетом регистра, без подстановочных знаков

проблема--
--иногда русская буква в начале нумерованного списка

5

Re: Удаление лишних концов абзацев

Еще идея: так как обычно вхождения таких фрагментов у меня множественные, можно было бы создать макрос, который бы копировал фрагмент вместе с концами абзацев, искал такие вхождения во всём документе и заменял концы абзаца на пробелы. В написании макросов познания у меня не глубокие, поэтому прошу помощи у опытных товарищей. Можно такое сотворить?

6

Re: Удаление лишних концов абзацев

shanemac51 пишет:

найти и заменить "знак конца абзаца + следующую за ним строчную букву".

я это делаю, прогоняя 33 раза запрос на замену ^p+русскаяБуква, но с учетом регистра, без подстановочных знаков

Спасибо! Но в моём случае будет заморочно, так как много сырого теста с как раз такими списками, даже не маркированными, просто например подписи к картинкам в виде списка. Один раз их пройти ещё куда ни шло, а 33 перебор smile

7

Re: Удаление лишних концов абзацев

Пробовал просто заменять ^p на пробел через Ctrl+H (написал визуально макрос), но почему-то он удаляет сразу во всём документе, а не в выделенном фрагменте.

8

Re: Удаление лишних концов абзацев

shanemac51 пишет:

. Один раз их пройти ещё куда ни шло, а 33 перебор smile

проблем мне это не создавало
распознаю я всегда с сохранением разбивки на строки и страницы в файнридере
формат просто текст или форматирование
расстановка областей ручная или подконтрольная

никакой автоматики

9

Re: Удаление лишних концов абзацев

Но в моём случае будет заморочно, так как много сырого теста с как раз такими списками, даже не маркированными, просто например подписи к картинкам в виде списка

выложите пример результатов вашего распознавания, чтобы оценить методику вашей работы

10

Re: Удаление лишних концов абзацев

shanemac51 пишет:

выложите пример результатов вашего распознавания, чтобы оценить методику вашей работы

В Файнридере - выделение либо вручную, если структура сложная, либо если попроще - на автомате с последующей коррекцией. Вывожу чаще всего в Ворд, простой текст. Часто приходится распознавать надписи на картинках, графиках, диаграммах. В результате и появляются "списки" с концами абзацев и строчными буквами.