Удаление лишних концов абзацев

1 Тема от noone99 26.08.2017 21:27:12

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Тема: Удаление лишних концов абзацев

Добрый день!

Есть задача удалить

2 Ответ от noone99 26.08.2017 21:39:47

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Re: Удаление лишних концов абзацев

Что-то пошло не так. Отправились только три первых слова из сообщения. При этом редактировать сообщение или удалить я не могу. Странно. Пишу еще раз.

Есть задача удалить лишнее в конце абзацев (после распознавания в FineReader). Что пришло в голову: найти и заменить "знак конца абзаца + следующую за ним строчную букву". Проблема в том, что в режиме подстановочных знаков Word не позволяет искать концы абзацев. Кроме того, почему-то при поиске [а-я] ищет не только строчные, но и прописные буквы. В общем, вариантные сработал.

Макросы с определением абзацев по наличию точки в конце не подходят, потому что тогда сольются все списки, где точек в конце строки часто нет.

Может быть, у кого-то есть другое решение?
Хэлп и сэнкс!

3 Ответ от noone99 26.08.2017 21:42:46

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Re: Удаление лишних концов абзацев

Да что такое ! )

Первая фраза: "Есть задача удалить лишнИЕ концЫ абзацев".

4 Ответ от shanemac51 26.08.2017 22:07:47

shanemac51
генерал-полковник
Неактивен

Зарегистрирован: 05.03.2012
Сообщений: 467
Поблагодарили: 119
За сообщение: 1

Re: Удаление лишних концов абзацев

найти и заменить "знак конца абзаца + следующую за ним строчную букву".

я это делаю, прогоняя 33 раза запрос на замену ^p+русскаяБуква, но с учетом регистра, без подстановочных знаков

проблема--
--иногда русская буква в начале нумерованного списка

5 Ответ от noone99 27.08.2017 15:37:15

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Re: Удаление лишних концов абзацев

Еще идея: так как обычно вхождения таких фрагментов у меня множественные, можно было бы создать макрос, который бы копировал фрагмент вместе с концами абзацев, искал такие вхождения во всём документе и заменял концы абзаца на пробелы. В написании макросов познания у меня не глубокие, поэтому прошу помощи у опытных товарищей. Можно такое сотворить?

6 Ответ от noone99 27.08.2017 15:41:52

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Re: Удаление лишних концов абзацев

shanemac51 пишет:

найти и заменить "знак конца абзаца + следующую за ним строчную букву".
я это делаю, прогоняя 33 раза запрос на замену ^p+русскаяБуква, но с учетом регистра, без подстановочных знаков

Спасибо! Но в моём случае будет заморочно, так как много сырого теста с как раз такими списками, даже не маркированными, просто например подписи к картинкам в виде списка. Один раз их пройти ещё куда ни шло, а 33 перебор

7 Ответ от noone99 27.08.2017 15:46:24

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Re: Удаление лишних концов абзацев

Пробовал просто заменять ^p на пробел через Ctrl+H (написал визуально макрос), но почему-то он удаляет сразу во всём документе, а не в выделенном фрагменте.

8 Ответ от shanemac51 27.08.2017 17:30:25

shanemac51
генерал-полковник
Неактивен

Зарегистрирован: 05.03.2012
Сообщений: 467
Поблагодарили: 119

Re: Удаление лишних концов абзацев

shanemac51 пишет:

. Один раз их пройти ещё куда ни шло, а 33 перебор

проблем мне это не создавало
распознаю я всегда с сохранением разбивки на строки и страницы в файнридере
формат просто текст или форматирование
расстановка областей ручная или подконтрольная

никакой автоматики

9 Ответ от shanemac51 27.08.2017 17:33:21

shanemac51
генерал-полковник
Неактивен

Зарегистрирован: 05.03.2012
Сообщений: 467
Поблагодарили: 119

Re: Удаление лишних концов абзацев

Но в моём случае будет заморочно, так как много сырого теста с как раз такими списками, даже не маркированными, просто например подписи к картинкам в виде списка

выложите пример результатов вашего распознавания, чтобы оценить методику вашей работы

10 Ответ от noone99 28.08.2017 23:57:40

noone99
сержант
Неактивен

Зарегистрирован: 05.08.2017
Сообщений: 11

Re: Удаление лишних концов абзацев

shanemac51 пишет:

выложите пример результатов вашего распознавания, чтобы оценить методику вашей работы

В Файнридере - выделение либо вручную, если структура сложная, либо если попроще - на автомате с последующей коррекцией. Вывожу чаще всего в Ворд, простой текст. Часто приходится распознавать надписи на картинках, графиках, диаграммах. В результате и появляются "списки" с концами абзацев и строчными буквами.

Удаление лишних концов абзацев

Сообщений [ 10 ]

1 Тема от noone99 26.08.2017 21:27:12

Тема: Удаление лишних концов абзацев

2 Ответ от noone99 26.08.2017 21:39:47

Re: Удаление лишних концов абзацев

3 Ответ от noone99 26.08.2017 21:42:46

Re: Удаление лишних концов абзацев

4 Ответ от shanemac51 26.08.2017 22:07:47

Re: Удаление лишних концов абзацев

5 Ответ от noone99 27.08.2017 15:37:15

Re: Удаление лишних концов абзацев

6 Ответ от noone99 27.08.2017 15:41:52

Re: Удаление лишних концов абзацев

7 Ответ от noone99 27.08.2017 15:46:24

Re: Удаление лишних концов абзацев

8 Ответ от shanemac51 27.08.2017 17:30:25

Re: Удаление лишних концов абзацев

9 Ответ от shanemac51 27.08.2017 17:33:21

Re: Удаление лишних концов абзацев

10 Ответ от noone99 28.08.2017 23:57:40

Re: Удаление лишних концов абзацев

Сообщений [ 10 ]

Похожие темы

страницы

авторство

рубрики