Создание N-грамма из предложения

Как сгенерировать n-грамм строки вроде:

String Input="This is my car."

Я хочу сгенерировать n-грамм с этим вводом:

Input Ngram size = 3

Вывод должен быть:

This
is
my
car

This is
is my
my car

This is my
is my car

Дайте некоторое представление о Java, как это реализовать, или если для этого доступна какая-либо библиотека.

Я пытаюсь использовать этот NGramTokenizer , но он дает n-грамм последовательности символов, а мне нужны n-граммы последовательности слов.

28
задан Bill the Lizard 18 September 2012 в 14:02
поделиться