Если вы хотите создать список автоматически:
Очистите твиттер и, возможно, блоги, для которых вы можете получить RSS-каналы. Используйте их для создания корпуса цепи Маркова и поиска синтаксического анализа с очень высокой вероятностью. Я подозреваю, что клише будут очень нормальными в начале, но будут иметь необычно низкую энтропию ближе к концу. То есть, когда вы видите «X Y Z», вы можете с почти уверенностью сказать, что следующими словами будут «A B C».
Вы легко сможете получить список с http://evilpettingzoo.com/wheel/ .
Сайт клише содержит список из 2100 идиом. Список выглядит довольно легко собрать.
Вот вам огромный список (AK), LZ на следующей странице:
http://www.learn-english-today.com /proverbs/proverbs.html
Кроме того, в Wikiquote есть для вас связка:
http://en.wikiquote.org/wiki/English_proverbs
Если вам нужен список клише, не смотрите дальше: http://clichesite.com/alpha_list.asp?which=lett+1
На обоих этих сайтах есть три упомянутых вами: