Расчет IDF (как в TF-IDF)при тестировании?

Насколько я понимаю, IDF используется для вычисления того, сколько документов имеют термин (вроде просто идея). Вы можете рассчитать IDF (вместе с TF)в обучающем наборе, так как у вас есть все документы заранее. Но что, если у меня нет тестового набора заранее и я получаю тестовые документы последовательно (как из поискового робота), то как я буду вычислять IDF для слов в документе, когда дело доходит до тестирования?

6
задан hippietrail 18 October 2012 в 08:22
поделиться