1

Тема: Поиск повторяющихся фрагментов

Всем добрый вечер. Такая задача. Имеем файл ворд, в котором ведется своеобразная база - фио, адрес, заказ, телефон, комментарии. Около 5000 позиций предположим. Все это очень неаккуратно заполнено. Где-то данные человека подряд идут, где-то с табуляцией, множественные пробелы (можно было бы их удалить, но они кое-где нужны), разные шрифты... Тяп-ляп документ. Т.е. вариант "поиск повторяющихся абзацев" не пройдет. Сортировка тоже не прокатит. Я искала людей по списку, пользуясь полем найти слева, т.е. у меня при вводе фамилии или города выпадали определенные результаты слева, я быстренько их просматривала, выбирала нужного мне человека. Там видно было, что много дублей. Но сразу удалить их не получилось, так как задача была другая - быстро отметить людей.
Теперь вот надо поудалять одинаковые позиции. Можно, конечно, подряд вбивать фамилии, как они идут в файле и смотреть, выпадут ли дубли, но это очень сложно по объему. Есть ли возможность пользуясь именно полем найти, которое панелью слева, забить поиск на повторяющиеся фрагменты текста, чтобы они все выпали, как обычные результаты поиска? И по-быстрому их просмотреть. Что-то вроде "найти два повторяющихся слова и показать"? Все, конечно, бы не нашло, но все же хоть что-то.


Иванов Петр Игоревич, самара, петровская 45, заказал телевизор по цене 3000, отправили
Семенов Олег Алексеевич самара, московская 89, машинка, думает, 7000
Самара, петровская45             Иванов Петр Игоревич,,, самара, петровская45, заказал телевизор по цене 6000, звонили


Примерно так, только все еще хуже, документ не могу выложить.  Вот надо, чтобы мне выдало Иванов Петр Игоревич, а я глазами бы просмотрела, какого удалить, какого оставить. Какие-нибудь варианты есть?

2

Re: Поиск повторяющихся фрагментов

Мне не надо, чтобы они выделились цветом, или что-то там. А именно, быстрый доступ. Как в поле найти слева выпало бы при вводе иванов два результата.