1

Тема: Абзацы в при преобразовании pdf в doc

Будьте добры, можно ли решить такую задачу

1.Имеем после преобразования текст каждая строка, которого заканчивается символом абзаца. Смысловые абзацы отделены красными строками, организованными через ненулевой отступ первой строки ( .FirstLineIndent = CentimetersToPoints(1) ).
2. Алгоритм мог бы быть таким - как-то пометить эти отступы "служебными" символами типа qqqqqqqqqq, а потом  действовать через стандартный пункт замены (Заменить). Но как пометить - не понимаю.
3. Если проблема решена - ткните носом, поиском не нашел.

2

Re: Абзацы в при преобразовании pdf в doc

пример--пример--пример--пример--

   рррррррррррррррррррррр
оооооооооооооооо
иииииииииииииииии
ииииииииииииииииииии

   шшшшшшшшшшшшшшшшшшшшшш
оооооооооооооооооооооооооо
ррррррррррррррррррррррррррр

===============
   рррррррррррррррррррррр оооооооооооооооо иииииииииииииииии ииииииииииииииииииии

   шшшшшшшшшшшшшшшшшшшшшш оооооооооооооооооооооооооо ррррррррррррррррррррррррррр


текст гладкий или табличный
как оформлены заголовки

3

Re: Абзацы в при преобразовании pdf в doc

Пример  прилагаю. В основном текст без таблиц. Таблицы есть , но это пока не проблема.

Post's attachments

Fragment.docx 14.97 Кб, 2 скачиваний с 2013-07-12 

You don't have the permssions to download the attachments of this post.

4

Re: Абзацы в при преобразовании pdf в doc

применяю макрос, попробуйте на копии

 Sub a__mrepl_rus()

S1 = "йцукенгшщзхъфывапролджэячсмитьбюё()"
's1 = s1 & "0123456789[-"
's1 = s1 & "qwertyuiopasdfghjklzxcvbnm"
j2 = Len(S1)
j1 = 0
Do While j1 < j2
j1 = j1 + 1
s2 = Mid(S1, j1, 1)
Debug.Print s2;
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = "^p" & s2
.Replacement.Text = " " & s2
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = True
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = "^l" & s2
.Replacement.Text = " " & s2
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = True
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute Replace:=wdReplaceAll
Loop
End Sub

5

Re: Абзацы в при преобразовании pdf в doc

забыла строку

Dim s1, s2, j1, j2

6

Re: Абзацы в при преобразовании pdf в doc

О, спасибо!  wink
На тестовом фрагменте сработало и на основном тексте тоже! Таблицы немного покорежились, но это не критично.
При беглом взгляде на макрос не понял, как он работает. Но работает...Объясните алгоритм, если не сложно, очень интересно...

7

Re: Абзацы в при преобразовании pdf в doc

замена (перевод строки + строчная буква) на (пробел+буква)
замена мягкого переноса на пробел

8

Re: Абзацы в при преобразовании pdf в doc

иногда требуется менять и цифры или латиницу  ---пока они закомментированы

-------
не меняется,если строка продолжение начинается с большой буквы ---иногда бывает