По-моему, это - довольно значительная дыра, которая подавляет широко распространенное принятие Solr. Новый DataImportHandler является хорошим первым шагом для импорта структурированных данных, но нет хорошего конвейера приема пищи документа для Solr. Nutch действительно работает, но интеграция между поисковым роботом Nutch и Solr несколько неуклюжа.
я попробовал каждый поисковый робот с открытым исходным кодом, который я могу найти, и ни один из них не интегрирует out-of-the-box с Solr.
Следят за OpenPipeline и Apache Tika.
Загрузите архив , а затем обратитесь к первой главе руководства пользователя Сборка и установка SCons . Вкратце:
# cd scons-1.2.0 # python setup.py install
Установите MacPorts , затем в Терминале (Приложения> Утилиты> Terminal.app) введите:
sudo port install scons
Эта команда автоматически загрузит и установит scons для вас. MacPorts требует, чтобы у вас были установлены инструменты разработчика, поэтому, если вы этого не сделаете, вам нужно будет загрузить и установить Xcode 3 DVD .
ПРИМЕЧАНИЕ 1: Xcode 2.5 - это последняя версия Xcode, которая будет работать в Mac OS X Tiger.
ПРИМЕЧАНИЕ 2: Это может показаться ужасно болезненным, если у вас еще не установлен MacPorts. Однако вам действительно стоит пойти по этому пути, поскольку MacPorts упрощает обновление установленного программного обеспечения, он автоматически управляет зависимостями между программным обеспечением и упрощает установку других пакетов в будущем.
Если у вас есть инструменты установки Python, следующее установит scons-1.2.0 из sourceforge:
easy_install scons
Но имейте в виду проблемы, которые люди поднимают с помощью setuptools.
Также имейте в виду этот вопрос и ответы о virtualenv и pip для изоляции сред Python.