Списки слов Кевина - лучшее, что я знаю только по спискам слов.
WordNet лучше, если вы хотите знать о существительных, глаголах и т. Д., Синонимах и т. Д.
' "миллион слова" обман катается ', я вижу ;-)
, Как сделать Ваши списки слов дольше: учитывая существительное, добавьте любое из следующих к нему: не - псевдо - полу-arific, - фанат...; с необходимыми изменениями для глаголов и т.д.
Я провел исследование для Пердью в области управляемого / естественный английский и обработка знаний проблемной области языка.
я смотрел бы на attempto проект: http://attempto.ifi.uzh.ch/site/description/ , который является проектом помочь создать управляемый естественный английский.
можно загрузить их весь словарь слова в: http://attempto.ifi.uzh.ch/site/downloads/files/clex-6.0-080806.zip это имеет ~ 100 000 естественных английских слов.
можно также предоставить собственный словарь для зависящих от домена слов, это - то, что мы сделали в нашем исследовании. Они предлагают веб-сервисы, чтобы проанализировать и отформатировать естественный английский текст.
Кто сказал Вам, что был 1 миллион слов? Согласно Википедия , Оксфордский словарь английского языка только имеет 600,000. И OED пытается включать всех технических и жаргонные слова, которые используются.