Индексирование и запрос URL-адресов в Solr

У меня есть база данных URL-адресов, по которым я хотел бы выполнить поиск. Поскольку URL-адреса не всегда записываются одинаково (могут иметь или не иметь www), я ищу правильный способ индексирования и запроса URL-адресов. Я пробовал несколько вещей и думаю, что близок к этому, но не уверен, почему это не работает:

Вот мой тип настраиваемого поля:

 
  
    
    
    
  
  
    
    
    
  

Например:

http: // www. twitter.com/AndersonCooper при индексировании будут иметь следующие слова в разных позициях: http, www, twitter, com, andersoncooper

Если я буду искать просто twitter.com/andersoncooper, я бы хотел, чтобы этот запрос соответствовал запись, которая была проиндексирована, поэтому я также использую WDF для разделения поискового запроса, однако поисковый запрос в конечном итоге выглядит так:

myfield :( "twitter com andersoncooper") когда действительно нужно, чтобы он соответствовал всем записям, содержащим все следующие отдельные слова: twitter com andersoncooper

Есть другой запрос фильтр или токенизатор, который мне следует использовать?

7
задан KidA78 13 January 2011 в 18:59
поделиться