Тема: Удаление лишних концов абзацев
Добрый день!
Есть задача удалить
Вы не вошли. Пожалуйста, войдите или зарегистрируйтесь.
Страницы 1
Чтобы отправить ответ, вы должны войти или зарегистрироваться
Добрый день!
Есть задача удалить
Что-то пошло не так. Отправились только три первых слова из сообщения. При этом редактировать сообщение или удалить я не могу. Странно. Пишу еще раз.
Есть задача удалить лишнее в конце абзацев (после распознавания в FineReader). Что пришло в голову: найти и заменить "знак конца абзаца + следующую за ним строчную букву". Проблема в том, что в режиме подстановочных знаков Word не позволяет искать концы абзацев. Кроме того, почему-то при поиске [а-я] ищет не только строчные, но и прописные буквы. В общем, вариантные сработал.
Макросы с определением абзацев по наличию точки в конце не подходят, потому что тогда сольются все списки, где точек в конце строки часто нет.
Может быть, у кого-то есть другое решение?
Хэлп и сэнкс!
Да что такое ! )
Первая фраза: "Есть задача удалить лишнИЕ концЫ абзацев".
найти и заменить "знак конца абзаца + следующую за ним строчную букву".
я это делаю, прогоняя 33 раза запрос на замену ^p+русскаяБуква, но с учетом регистра, без подстановочных знаков
проблема--
--иногда русская буква в начале нумерованного списка
Еще идея: так как обычно вхождения таких фрагментов у меня множественные, можно было бы создать макрос, который бы копировал фрагмент вместе с концами абзацев, искал такие вхождения во всём документе и заменял концы абзаца на пробелы. В написании макросов познания у меня не глубокие, поэтому прошу помощи у опытных товарищей. Можно такое сотворить?
найти и заменить "знак конца абзаца + следующую за ним строчную букву".
я это делаю, прогоняя 33 раза запрос на замену ^p+русскаяБуква, но с учетом регистра, без подстановочных знаков
Спасибо! Но в моём случае будет заморочно, так как много сырого теста с как раз такими списками, даже не маркированными, просто например подписи к картинкам в виде списка. Один раз их пройти ещё куда ни шло, а 33 перебор
Пробовал просто заменять ^p на пробел через Ctrl+H (написал визуально макрос), но почему-то он удаляет сразу во всём документе, а не в выделенном фрагменте.
. Один раз их пройти ещё куда ни шло, а 33 перебор
проблем мне это не создавало
распознаю я всегда с сохранением разбивки на строки и страницы в файнридере
формат просто текст или форматирование
расстановка областей ручная или подконтрольная
никакой автоматики
Но в моём случае будет заморочно, так как много сырого теста с как раз такими списками, даже не маркированными, просто например подписи к картинкам в виде списка
выложите пример результатов вашего распознавания, чтобы оценить методику вашей работы
выложите пример результатов вашего распознавания, чтобы оценить методику вашей работы
В Файнридере - выделение либо вручную, если структура сложная, либо если попроще - на автомате с последующей коррекцией. Вывожу чаще всего в Ворд, простой текст. Часто приходится распознавать надписи на картинках, графиках, диаграммах. В результате и появляются "списки" с концами абзацев и строчными буквами.
Страницы 1
Чтобы отправить ответ, вы должны войти или зарегистрироваться