greensnace пишет:Есть много англо - русских словарей в PDF которые необходимо перевести в WORD или EXCEL в виде таблицы. В идеале хотелось бы автоматически заменить пробел между Латиницей и кириллицей заменить на знак табулятора, но практически не получается.
Возможно ли это реализовать средствами WORD или EXCEL?
Если можно, то лучше для обработки планируйте не PDF-файлы, а файлы Word. Дело в том, что PDF-файл может быть сформирован нехитрым инструментом, преобразующим текст в картинку, и тогда вы из такого файла с помощью VBA ничего не прочтете. То есть, я предлагаю для начала сконвертировать все ваши PDF-файлы в файлы Word (если нет оригиналов на самом Word). Хороший инструмент, напр., Solid Converter PDF или ABBYY PDF Transformer. Их преимущество в том, что они, используя принцип распознавания текста, превращают файлы PDF в редактируемый формат, который может быть программно обработан.
Если PDF сформирован из Word путем экспорта или через Acrobat Professional, то можно попытаться читать его - примеры есть (см., напр., внешняя ссылка
По алгоритму обработки (если бы текст словаря был в Word): он довольно простой. Просканировать абзацы текста. Если абзац непустой и содержит вначале нерусский текст, то выделить этот текст и из него сформировать статью исходного слова, а из остатка абзаца - статью перевода. Разумеется, это только грубая обработка.