Мне просто интересно, каково использование n -граммов (n>3)(и частоты их появления ), учитывая вычислительные накладные расходы в их вычисление. Есть ли приложения, в которых биграмм или триграмм просто недостаточно?
Если да, то каково состояние ---искусства извлечения n -граммов? Какие-либо предложения? Мне известны следующие: