Я собирался интегрировать Основанный на сфинксе поиск в веб-сайт, но я нашел, что нет никакой созданной поддержки исправления орфографических ошибок.
Люди в сети предлагают использовать pspell или другие сторонние библиотеки для добиваний цели, но проблемой являются данные, в которых я собираюсь искать, содержит главным образом "технические" термины как торговые марки, таким образом я не думаю, что общие библиотеки будут включать их.
С другой стороны, состояния Xapian, чтобы иметь поддержку исправления орфографических ошибок на основе индексированных данных, так точно, что я хочу. Действительно ли стоит использовать Xapian вместо этого? Я все еще вполне смущен, которого механизма полнотекстового поиска я должен использовать: Сфинкс, кажется, довольно хорош, но испытывающий недостаток в некоторых замечательных функциях Xapian (или возможно Lucene?), в то время как это похоже, у последнего есть меньшее сообщество и меньше документации.
Я думаю, что могу решить проблему со словами, не существующими в pspell словаре с помощью пользовательского для него, но я не уверен, наложит ли это значимые потери производительности? Я собираюсь использовать поисковую систему для поиска центра внимания (отдельный поиск через ajax на каждой вводимой букве) на довольно популярном веб-сайте, таким образом, производительность имеет значение.
Идеально, я хотел бы заставить некоторые поля как торговые марки иметь больше приоритета над общим словарем, но я предполагаю, что это не действительно важно начиная с большинства торговых марок a, довольно отличных от других слов.
Любые предложения на общем дизайне пользовательского механизма полнотекстового поиска приветствуются также.
Спасибо