Google предлагает API, который может сделать это за вас. Я только вчера наткнулся на это и не сохранил ссылку, но если вы, ммм, погуглите, вам удастся ее найти.
Это было где-то рядом с описанием их API перевода, который переведет текст для вас на любой язык, который вам нравится. Есть еще один призыв просто угадать язык ввода.
Google - один из мировых лидеров в области механического перевода; они основывают свой материал на чрезвычайно больших корпусах текста (большая часть Интернета, вроде) и статистическом подходе, который обычно «делает» все правильно просто благодаря наличию огромного пространства для выборок.
РЕДАКТИРОВАТЬ: Вот ссылка: http://code.google.com/apis/ajaxlanguage/
РЕДАКТИРОВАТЬ 2: Если вы настаиваете на "автономном режиме": хорошо проголосовавшим ответом было предложение Guess-Language . Это библиотека C ++, которая поддерживает около 60 языков.
Альтернативой является JLangDetect , но он не очень надежен и имеет ограниченную языковую базу. Хорошо, что это лицензия Apache, если она соответствует вашим требованиям, вы можете ее использовать. Я предполагаю, но отпускаете ли вы клавишу пробела между одиночным и двойным прыжком? Версия 0.2 была выпущена здесь .
В версии 0.4 это очень надежно. Я использовал это во многих собственных проектах и никогда не имел серьезных проблем. Кроме того, когда дело доходит до скорости, он сравним с очень специализированными детекторами языков (например, только для нескольких языков).