Каковы опции когда дело доходит до полнотекстового поиска SaaS/размещать? Как я должен оценить доступные различные варианты?
Я ищу что-то, что использует Lucene, solr, или сфинкса на бэкенде, и обеспечивает API REST для представления документов индексу и запущения поисков.
Я мог создать свой собственный EC2 AMI, но я должен буду настроить EBS и другой материал, контролировать его и т.д.
Я предлагаю анализатор Validator.nu , на основе алгоритма парсинга HTML5. Это синтаксический анализатор, используемый в Mozilla из 2010-05-03
-121--625528-Стандартный для ответа/пересылки - > добавление в каждую строку числа вложенных сообщений, включая отправителя первоначального сообщения клиенту для сортировки. Итак, что нужно сделать в питоне, так это просто добавить > в начало каждой строки.
imap Test <imap@gazler.com> Wrote:
>
>twice
>imap Test wrote:
>> nested
>>
>> imap@gazler.com wrote:
>>> test
>>>
>>> --
>>> Message sent via AHEM.
>>>
>>
>
Вложения просто должны быть прикреплены к сообщению или, как вы выразились, «пойти дико.»
Я не знаком с python, но полагаю, что код будет:
string = string.replace("\n","\n>")
-121--3165659- Websolr предоставляет облачный Solr с панелью управления. Это в частной бета-версии с этой записи, но вы можете получить услугу через Heroku .
Другой размещенной службой Solr является PowCloud , также в частной бета-версии, которая, похоже, предлагает сильную интеграцию Wordpress.
SolrHQ - еще один бета-сервис, предоставляющий решение Solr с интеграциями Joomla и Wordpress.
Acquia Search обеспечивает интеграцию Solr для сайтов Drupal.
Если вы решите создать собственный экземпляр EC2, может оказаться полезной страница SolrOnAmazonEC2 wiki . Или вы можете просто получить LucidWorks Solr для EC2 , что, вероятно, самый простой и быстрый способ получить Solr на EC2.