Читайте о подходе TEX к этой проблеме в целях расстановки переносов. Особенно посмотрите Frank Liang диссертация тезиса Word Hy-phen-a-tion Компьютером . Его алгоритм очень точен, и затем включает маленький словарь исключений для случаев, где алгоритм не работает.
Perl имеет Язык:: Фонология:: Слог модуль. Вы могли бы попробовать это или попытаться изучить его алгоритм. Я видел несколько других более старых модулей там, также.
я не понимаю, почему регулярное выражение дает Вам только количество слогов. Необходимо смочь получить сами слоги с помощью круглых скобок получения. Принятие Вас может создать регулярное выражение, которое работает, который является.
Я споткнулся через эту страницу, ища то же самое и нашел несколько реализаций статьи Liang здесь: https://github.com/mnater/hyphenator
, Который является, если Вы не тип, который любит читать тезис на 60 страниц вместо того, чтобы адаптировать код в свободном доступе к групповой проблеме. :)
Зачем это вычислять? Эта информация есть в каждом онлайн-словаре. http://dictionary.reference.com/browse/invisible in · vis · i · ble