1

Тема: Конвертация PDF - Word с сохранением оригинального форматирования

Добрый день!

По работе моя задача - сохранить в Word форматирование, максимально приближенное к оригинальному (чаще всего PDF), причём так, чтобы после перевода в переводческой (CAT) программе оно не съехало. Обычно использую либо экспорт из Adobe Acrobat в .docx, либо непосредственно преобразование в Ворде, либо FineReader (c последним проблем поменьше, но уходит больше времени на распознавание, и формат абзацев и текста может непредсказуемо

2

Re: Конвертация PDF - Word с сохранением оригинального форматирования

Почему-то в первом сообщении не догрузилась часть текста. Дублирую полностью.

Добрый день!

По работе моя задача - сохранить в Word форматирование, максимально приближенное к оригинальному (чаще всего PDF), причём так, чтобы после перевода в переводческой (CAT) программе оно не съехало. Обычно использую либо экспорт из Adobe Acrobat в .docx, либо непосредственно преобразование в Ворде, либо FineReader (c последним проблем поменьше, но уходит больше времени на распознавание, и формат абзацев и текста может непредсказуемо «съехать», несмотря на режим экспорта.

Может быть, кто-то из форумчан в этой или близкой теме, и может поделиться какими-то "фишками"?

Из текущих проблем - например, большое количество разделов после преобразования PDF в Word; непонятно, существует ли возможность группового преобразования надписей и фреймов (рамок) в текст; и другие.

Буду благодарен за ответ.

3

Re: Конвертация PDF - Word с сохранением оригинального форматирования

А файл PDF "векторный" или набор картинок? Если "векторный" то попробуйте найти "Nuance Convert Assistant" . Был крайне удивлен результатом. "Картинки на русском" не понимает. "Векторные" PDF на русском без проблем.

"Ты не умничай, ты пальцем покажи"
"Кто поработал с многоуровневым списком в Ворде, тот в цирке не смеется"

4

Re: Конвертация PDF - Word с сохранением оригинального форматирования

Когда-то я пользовался программой Solid Converter PDF. Но результат (файл Word) по сравнению с оригиналом, как правило, требует дополнительной шлифовки (стилизации), т.к. стили исходного документе потеряны, а форматирование абзацев (визуально доврльно точное) выгоняется генератором путем добавления мелких пустых абзацев. Но если исходнцый документ базирован на стилевом шаблоне, то стилизовать выходной документ на этом же стилевом шаблоне не составляет труда. Конечно, в результат иногда вкрадываются глюки, напр., текст из основной области пересместился в колонтитул, сгенерены фреймы, отсутствующие в оригинале и т.п. Но все-таки работа по получению

5

Re: Конвертация PDF - Word с сохранением оригинального форматирования

AlexStar пишет:

Если "векторный" то попробуйте найти "Nuance Convert Assistant" . Был крайне удивлен результатом. "Картинки на русском" не понимает. "Векторные" PDF на русском без проблем.

Спасибо! Установил пробную версию. Пока не вижу преимуществ перед Акробатом или ФайнРидером. То, что не распознаёт Акробат - не распознаёт и Nuance.

6

Re: Конвертация PDF - Word с сохранением оригинального форматирования

Приложите пару проблемных страниц PDF файла для теста. Спасибо

"Ты не умничай, ты пальцем покажи"
"Кто поработал с многоуровневым списком в Ворде, тот в цирке не смеется"