Реализация альтернативных форм LDA

Я использую скрытое распределение Дирихле с корпусом новостных данных из шести различных источников. Меня интересует эволюция темы, появление, и я хочу сравнить, насколько источники похожи и отличаются друг от друга с течением времени. Я знаю, что существует ряд модифицированных алгоритмов LDA, таких как модель Author-Top, Topics Over Time и так далее.

Моя проблема заключается в том, что очень немногие из этих спецификаций альтернативных моделей реализованы в каком-либо стандартном формате. Некоторые из них доступны на Java, но большинство из них существует только в виде документов для конференций. Как лучше всего реализовать некоторые из этих алгоритмов самостоятельно? Я довольно хорошо разбираюсь в R и jags, и могу спотыкаться в Python, если мне достаточно долго. Я готов написать код, но я действительно не знаю, с чего начать, и я не знаю C или Java. Могу ли я построить модель в JAGS или Python, просто используя формулы из рукописи? Если да, может ли кто-нибудь указать мне на пример этого? Спасибо.

7
задан 11 April 2012 в 19:20
поделиться