Извлечение данных о частоте из отсортированного списка фраз

После изучения документации / прошлых вопросов по операциям со списками я ничего не нашел - во многих случаях используются числа, тогда как я работаю с большим количеством текста.

У меня есть отсортированный список общих фраз из трех слов (триграмм), которые появляются в большом объеме текстовой информации, созданной с помощью команд Mathematica's Partition [], Tally [] и Sort []. Пример данных, с которыми я работаю (у меня сотни таких файлов):

{{{wa, wa, wa}, 66}, {{i, love, you}, 62}, {{ла, ла, ла}, 50}, {{значение, жизни}, 42}, {давай, давай, давай}, 40}, {{давай, давай, давай}, 40}, {{да , yeah, yeah}, 38}, {{no, no, no}, 36}, {{we, re, going}, 36}, {{you, love, me}, 35}, {{in, love , с}, 32}, {{, путь, ты}, 30}, {{я, хочу, к}, 30}, {{назад, мне}, 29}, <<38211>>, { {of, an, xke}, 1}}

Я надеюсь выполнить поиск в этом файле, чтобы, если вводится «смысл жизни», он вернул «42». Я чувствую, что, должно быть, не замечаю чего-то очевидного, но, повозившись, я наткнулся на кирпичную стену. У Mathematica очень много документации, что ... ну, неудивительно.

5
задан ROMANIA_engineer 19 October 2017 в 17:52
поделиться