Какое-либо латентно-семантическое индексирование?

Есть ли какая-либо реализация с открытым исходным кодом LSI в Java? Я хочу пользоваться той библиотекой для своего проекта. Я видел jLSI, но он реализует некоторую другую модель LSI. Я хочу стандартную модель.

6
задан Bakuriu 24 April 2014 в 08:26
поделиться

3 ответа

Рассматривали ли вы LDA (скрытое распределение по Дирихлету)? На самом деле я тоже не рассматривал, но недавно столкнулся с той же проблемой с LSI (патенты). Насколько я понимаю, LDA является родственной/более мощной техникой. http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation видимо имеет несколько ссылок на реализации с открытым исходным кодом.

5
ответ дан 16 December 2019 в 21:41
поделиться

Поиск в Google по запросу java LSI приводит к аналогичный вопрос , который рекомендует SemanticVectors. Пакет, созданный на основе Lucene, «похожий» на LSI. Не знаю, ближе ли это к реализации jLSI.

В этой ветке также упоминается, что LSI запатентована, и ее реализаций не так много. Так что, если вам нужна стандартная реализация, возможно, вам придется использовать язык, отличный от java.

1
ответ дан 16 December 2019 в 21:41
поделиться

Я полагаю, что LSA/LSI была запатентована в 1989 году, что означает, что срок действия патента должен был только что истечь. Надеюсь, мы скоро увидим несколько хороших приложений с открытым исходным кодом.

0
ответ дан 16 December 2019 в 21:41
поделиться
Другие вопросы по тегам:

Похожие вопросы: