Есть ли какая-либо реализация с открытым исходным кодом LSI в Java? Я хочу пользоваться той библиотекой для своего проекта. Я видел jLSI, но он реализует некоторую другую модель LSI. Я хочу стандартную модель.
Рассматривали ли вы LDA (скрытое распределение по Дирихлету)? На самом деле я тоже не рассматривал, но недавно столкнулся с той же проблемой с LSI (патенты). Насколько я понимаю, LDA является родственной/более мощной техникой. http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation видимо имеет несколько ссылок на реализации с открытым исходным кодом.
Поиск в Google по запросу java LSI приводит к аналогичный вопрос , который рекомендует SemanticVectors. Пакет, созданный на основе Lucene, «похожий» на LSI. Не знаю, ближе ли это к реализации jLSI.
В этой ветке также упоминается, что LSI запатентована, и ее реализаций не так много. Так что, если вам нужна стандартная реализация, возможно, вам придется использовать язык, отличный от java.
Я полагаю, что LSA/LSI была запатентована в 1989 году, что означает, что срок действия патента должен был только что истечь. Надеюсь, мы скоро увидим несколько хороших приложений с открытым исходным кодом.