SOLR и синтаксический анализ естественных языков - я могу использовать его?

Требования

Алгоритм частотности слова для обработки естественного языка

Использование Solr

В то время как ответ для того вопроса превосходен, я задавался вопросом, мог ли я использовать все время, я потратил узнающий SOLR для своей обработки естественного языка.

Я думал о SOLR потому что:

  1. Это имеет набор токенизаторов и выполняет большую обработку естественного языка.
  2. Это - симпатичное использование для использования из поля.
  3. Это - успокоительное распределенное приложение, таким образом, легко поднять трубку
  4. Я провел некоторое время с ним, таким образом использование могло сэкономить мне время.

Я могу использовать Solr?

Хотя вышеупомянутые основания являются серьезными, я не знаю SOLR, ЧТО хорошо, таким образом, я должен знать, подходило ли это для моих требований.

Идеальное использование

Идеально, я хотел бы настроить SOLR и затем смочь отправить SOLR некоторый текст и получить индексируемое tonkenized содержание.

Контекст

Я работаю над маленьким компонентом более крупного механизма рекомендации.

15
задан ROMANIA_engineer 21 October 2017 в 09:18
поделиться

1 ответ

Думаю, вы можете использовать Solr и комбинировать его с другими инструментами. Токенизация, удаление стоп-слов, выделение корней и даже синонимы идут прямо из коробки с Solr. Если вам нужно распознавание именованных сущностей или извлечение базовых именных фраз, вам необходимо использовать OpenNLP или аналогичный инструмент в качестве этапа предварительной обработки. Вам, вероятно, понадобятся векторы терминов для поиска. Интеграция Apache Mahout с Apache Lucene и Solr может быть полезна, поскольку в ней обсуждается интеграция Lucene и Solr с механизмом машинного обучения (включая рекомендации). В остальном, не стесняйтесь задавать более конкретные вопросы.

12
ответ дан 1 December 2019 в 03:13
поделиться
Другие вопросы по тегам:

Похожие вопросы: