Я хотел бы прояснить взаимосвязь между скрытым распределением Дирихле (LDA) и общей задачей кластеризации документов.
Анализ LDA имеет тенденцию выводить пропорции тем для каждого документа. Если я правильно понимаю, это не прямой результат кластеризации документов. Однако мы можем рассматривать эту вероятностную пропорцию как представление функции для каждого документа. После этого мы можем вызвать другой установленный метод кластеризации, основанный на конфигурациях функций, сгенерированных анализом LDA.
Правильно ли я понимаю? Спасибо.