Романизация текста Unicode

Я ищу способ транслитерировать буквенные символы Unicode из любого языка в латинские буквы с акцентом. Цель состоит в том, чтобы позволить иностранцам получить представление о произношении имен и слов, написанных любым нелатинским шрифтом.

Примеры:

Греческий: Романизация("Αλφαβητικός")возвращает "Alphabētikós"(или "Alfavi̱tikós")

Японский: Романизация("しんばし")возвращает "шимбаши"(или "синбаси")

Русский: Romanize("яйца Фаберже")возвращает "яйца Фаберже"(или "jajca Faberže")

В идеале он должен поддерживать символы следующих алфавитов: CJK, индийский, кириллический, семитский и греческий. Он должен управляться данными и расширяться, используя данные Консорциума Unicode, США, ЕС или ООН. Код должен быть с открытым исходным кодом, написанным на .NET или Java.

Существует ли такая библиотека?

22
задан Charles 23 March 2012 в 19:35
поделиться