Моделирование тем с помощью молотка

Я использовал молоток для определения тем для текстового файла, содержащего 100 000 строк (около 34 МБ в формате молотка). Но теперь мне нужно запустить его для файла, содержащего миллион строк (около 180 МБ), и я получаю исключение java.lang.outofmemory. Есть ли способ разбить файл на более мелкие и построить модель для данных, присутствующих во всех файлах вместе? заранее спасибо

6
задан Fred Foo 2 March 2011 в 14:35
поделиться