База данных WordNet может оказаться полезной. Однажды я работал над надстройкой Firefox, которая имеет дело со словами и всевозможными простыми и сложными ассоциациями между ними и прочим. Похоже, WordNet будет вам очень полезен.
Вот он в формате MySQL . И этот (ссылка из архива в Интернете) использует данные Wordnet v3.0, а не старые данные Wordnet 2.0.
Вы можете найти то, что вам нужно на infochimps.org.
У них есть список из 350 000 простых (т.е. несочетающихся) слов, доступных для бесплатного скачивания.
Список слов - 350,000+ простых английских слов
Что касается других языков, то вы, возможно, захотите поискать в Викисловариях. Вот ссылка на все резервные копии баз данных - информация не так уж и упорядочена, но если у них есть язык, то вы можете скачать данные в формате SQL.
Вы можете проверить * spell
словарь en-GB , используемый Mozilla, OpenOffice и множеством других программ.
Вы не сказали, для чего вам нужен этот список. Если чего-то, что используется в качестве черного списка для проверки паролей, достаточно, cracklib может быть вам полезен. Он содержит более 1,5 млн слов.
Не существует такого понятия, как «полный» список. У разных людей разные способы измерения - например, они могут включать сленг, неологизмы, многословные фразы, оскорбительные термины, иностранные слова, спряжения глаголов и т. Д. Некоторые люди даже насчитали миллион слов ! Так что вам нужно будет решить, что вы хотите от списка слов.