1

Тема: Учим word переносам для своего словаря

Доброго времени суток.
Господа, нужна помощь, словом аль делом.
Пытаюсь решить очень нехорошую задачу по переносу слов.
Для чего это все делается и почему.
Имеем такой текст, то что подчеркнуто, это нехороший перенос. то есть другими словами, это неправильный слоговой перенос. Вот как сейчас выглядит слово "Привет", всемто того чтоб перенос сработал на При-вет, он оборвал Приве-т
Учим word переносам для своего словаря
Так как к нему не применимы стандартные способы форматирования, хотелось бы создать макрос для этого.
Нам потребуется свод правил, файл IAST_HYPERN.vbee (открывается любым текстовым редактором, заточен под скрипт EmEditor)
И нам нужно описать условия при котором будут срабатывать переносы.
1) найти текст с разрывом
2) применить к нему правила из словаря
3) разорвать слово по нормальному
Имеем N prajānāṃpatayaḥ (на рисунке левая колонка, слово с отрванной ḥ)
Вопрос как его найти?
Далее, нужно выделить данное слово и применить к нему правило расстановки, например слова:

N bhūtānāmīśvaraḥ
N arjunasyavanavāsaḥ
H caṅkramyayuktāḥ
N sthāvarāṇāṃpatiḥ
N vanaspatīnāṃpatiḥ

после обработки макросом имеют вид

N 4b2h1ū3t1ā3n1ā3m1ī3ś3v1a5r1a4ḥ
N 1a3r2j1u4n1a4s3y1a5v1a3n1a2v1ā2s1a4ḥ
H 3c1a4ṅ2k3r1a4m3y1a2y1u1k2t1ā3ḥ
N 2s4t2h1ā4v1a4r1ā3ṇ1ā3ṃ3p1a2t1i3ḥ
N 3v1a5n1a4s3p1a4t1ī1n1ā3ṃ1p1a2t1i3ḥ

Что означают цифры? Это вероятные места для переноса, то есть мы сейчас слово поделили грубо говоря на слоги.
Остается лишь выбрать приемлемый вариант, какой??
Так как у нас страдает концовка то логично предположить что перенос нужно делать примерно начиная от 65% слова: при этом желательно выбрать наиболее большую цифру ближайшую к данной точке %
Пример:
N bhūtānāmīśv/тут скажем наши 65% начинаются/1a5r1a4ḥ
Мы видим что есть цифры 1, 5 и 4. Значит рвем на 5 получим
N bhūtānāmīśva-raḥ
N arjunasyavana/тут скажем наши 65% начинаются/v1ā2s1a4ḥ цифры 1, 2, 1,4 . Значит рвем на 2 , 4-ка в конце нас уже не устраивает так как опять 1 -2 буквы останутся

N arjunasyavanavā-saḥ 
H caṅkramyayuk-tāḥ
N sthāvarāṇāṃpa-tiḥ
N vanaspatīnāṃpa-tiḥ

то, что везде в конце отделилось 3 буквы совпадение. На них нельзя рассчитывать.
Ну вот такую задачку хочу решить.
Если вчитаться то все становится ясно, сам обдумывал неделю и рыл в строну программ Openoffice и LaTeX в которых это реализовано.
Сам макрос для разбивки удобочитаемый.
Буду рад любой помощи.

Post's attachments

IAST_HYPERN.vbee 28.71 Кб, 1 скачиваний с 2013-12-14 

You don't have the permssions to download the attachments of this post.

2

Re: Учим word переносам для своего словаря

Надеюсь разборки с openoffice не считаются сторонним урлом на другой сайт? пост из Openoffice
Там я не смог осилить всей мысли.