Я пытаюсь закодировать алгоритм диссоциированной прессы, основанный на n-грамме в scala. Как создать n-грамм для больших файлов: Например, для файла, содержащего «пчела - это пчела пчел».
Не могли бы вы подсказать, как это сделать? Приносим извинения за неудобства.