Как сгенерировать n-грамм строки вроде:
String Input="This is my car."
Я хочу сгенерировать n-грамм с этим вводом:
Input Ngram size = 3
Вывод должен быть:
This
is
my
car
This is
is my
my car
This is my
is my car
Дайте некоторое представление о Java, как это реализовать, или если для этого доступна какая-либо библиотека.
Я пытаюсь использовать этот NGramTokenizer , но он дает n-грамм последовательности символов, а мне нужны n-граммы последовательности слов.