Как обнаружить язык вводимого пользователем текста? [закрытый]

40
задан Community 23 May 2017 в 11:54
поделиться

3 ответа

20
ответ дан 27 November 2019 в 01:47
поделиться

Google предлагает API, который может сделать это за вас. Я только вчера наткнулся на это и не сохранил ссылку, но если вы, ммм, погуглите, вам удастся ее найти.

Это было где-то рядом с описанием их API перевода, который переведет текст для вас на любой язык, который вам нравится. Есть еще один призыв просто угадать язык ввода.

Google - один из мировых лидеров в области механического перевода; они основывают свой материал на чрезвычайно больших корпусах текста (большая часть Интернета, вроде) и статистическом подходе, который обычно «делает» все правильно просто благодаря наличию огромного пространства для выборок.

РЕДАКТИРОВАТЬ: Вот ссылка: http://code.google.com/apis/ajaxlanguage/

РЕДАКТИРОВАТЬ 2: Если вы настаиваете на "автономном режиме": хорошо проголосовавшим ответом было предложение Guess-Language . Это библиотека C ++, которая поддерживает около 60 языков.

6
ответ дан 27 November 2019 в 01:47
поделиться

Альтернативой является JLangDetect , но он не очень надежен и имеет ограниченную языковую базу. Хорошо, что это лицензия Apache, если она соответствует вашим требованиям, вы можете ее использовать. Я предполагаю, но отпускаете ли вы клавишу пробела между одиночным и двойным прыжком? Версия 0.2 была выпущена здесь .

В версии 0.4 это очень надежно. Я использовал это во многих собственных проектах и ​​никогда не имел серьезных проблем. Кроме того, когда дело доходит до скорости, он сравним с очень специализированными детекторами языков (например, только для нескольких языков).

2
ответ дан 27 November 2019 в 01:47
поделиться
Другие вопросы по тегам:

Похожие вопросы: