Взаимосвязь между скрытым распределением Дирихле и кластеризацией документов

Я хотел бы прояснить взаимосвязь между скрытым распределением Дирихле (LDA) и общей задачей кластеризации документов.

Анализ LDA имеет тенденцию выводить пропорции тем для каждого документа. Если я правильно понимаю, это не прямой результат кластеризации документов. Однако мы можем рассматривать эту вероятностную пропорцию как представление функции для каждого документа. После этого мы можем вызвать другой установленный метод кластеризации, основанный на конфигурациях функций, сгенерированных анализом LDA.

Правильно ли я понимаю? Спасибо.

9
задан chl 29 July 2011 в 03:17
поделиться