Быстрый расчет n-граммов

Я использую NLTK для поиска n-граммов в корпусе, но в некоторых случаях это занимает очень много времени. Я заметил, что вычисление n-граммов не является редкостью в других пакетах (очевидно, Haystack имеет для этого некоторую функциональность). Означает ли это, что есть потенциально более быстрый способ найти n-граммы в моем корпусе, если я откажусь от NLTK? Если да, что я могу использовать для ускорения работы?

18
задан Michael J. Barber 29 September 2011 в 10:51
поделиться