Тема: создать список слов где встречаются слоги
Доброго времени суток, форумчане.
И что не день то сказка и новые познания.
Прошу помощи в реализации алгоритма поиска и его допиливания.
Как всегда имеем море лигатур, около 1500
ра, ро, мы, мам, дама
И имеем текст "пока что постраничный - каждая глава отдельный лист" написано построчно.
Необходимо:
1) найти по 2 слова где встречаются данные слоги
2) посчитать их количество в книге вообще
3) по возможности вытянуть строку, где они встречаются. (но это уже так - бредни на ночь)
Алгоритм думаю такого плана.
1) Сортируем список слогов по количеству букв Я-А
дама, мам, ра, ро, мы
2) создаем массив лигатур
3) поиском/заменой пытаемся найти слог
3.1) Если найдено, как-то забираем слово.
3.3.1) по возможности забираем строку
4) если найдено повторяем пункт 3) или переходим к другому слогу.
5) вычисляем сколько всего таких совпадений есть.
Прошу помощи в реализации. Возможно неправильный подход?
Пример:
Мама мыла раму, рама мыла маму
Мама моет руки, маленьким кусочком мыльца
Получаем
дама-0
мам-3 Мама (повторы не учитываем)
ра-2 раму
ро-0
мы-3 мыла, мыльца