Исправление орфографических ошибок у Сфинкса?

Я собирался интегрировать Основанный на сфинксе поиск в веб-сайт, но я нашел, что нет никакой созданной поддержки исправления орфографических ошибок.

Люди в сети предлагают использовать pspell или другие сторонние библиотеки для добиваний цели, но проблемой являются данные, в которых я собираюсь искать, содержит главным образом "технические" термины как торговые марки, таким образом я не думаю, что общие библиотеки будут включать их.

С другой стороны, состояния Xapian, чтобы иметь поддержку исправления орфографических ошибок на основе индексированных данных, так точно, что я хочу. Действительно ли стоит использовать Xapian вместо этого? Я все еще вполне смущен, которого механизма полнотекстового поиска я должен использовать: Сфинкс, кажется, довольно хорош, но испытывающий недостаток в некоторых замечательных функциях Xapian (или возможно Lucene?), в то время как это похоже, у последнего есть меньшее сообщество и меньше документации.

Я думаю, что могу решить проблему со словами, не существующими в pspell словаре с помощью пользовательского для него, но я не уверен, наложит ли это значимые потери производительности? Я собираюсь использовать поисковую систему для поиска центра внимания (отдельный поиск через ajax на каждой вводимой букве) на довольно популярном веб-сайте, таким образом, производительность имеет значение.

Идеально, я хотел бы заставить некоторые поля как торговые марки иметь больше приоритета над общим словарем, но я предполагаю, что это не действительно важно начиная с большинства торговых марок a, довольно отличных от других слов.

Любые предложения на общем дизайне пользовательского механизма полнотекстового поиска приветствуются также.

Спасибо

7
задан htf 19 May 2010 в 09:11
поделиться