Я делаю поиск Сфинкса, но поднимаю некоторые действительно странные результаты. Любая справка ценится.
Так, например, если я тип "50", я добираюсь:
Здорово, но когда я ищу "50 Ce", я добираюсь:
И другие сумасшедшие результаты. Также, когда я ищу "50 центов", корректный результат наверху, но затем случайные результаты ниже. Какие-либо идеи, почему?
Код PHP:
$query = $_GET['query'];
if (!empty($query))
{
$sphinx->SetMatchMode(SPH_MATCH_ALL);
$sphinx->AddQuery($query, 'artists');
$sphinx->AddQuery($query, 'variations');
$sphinx->SetFilter('name', array(3));
$sphinx->SetLimits(0, 10);
$result = $sphinx->RunQueries();
echo '<pre>';
switch ($result)
{
case false:
echo 'Query failed: ' . $sphinx->GetLastError() . "\n";
break;
default:
if ($sphinx->GetLastWarning())
{
echo 'WARNING: ' . $sphinx->GetLastWarning() . "\n";
}
if (is_array($result[0]['matches']) && count($result[0]['matches']))
{
foreach ($result[0]['matches'] as $value => $info)
{
$artist = artistDetails($value);
echo $artist['name'] . "\n";
}
}
}
}
Индекс сфинкса и источник:
source artists
{
type = mysql
sql_host = localhost
sql_user = user
sql_pass = pass
sql_db = db
sql_port = 3300
sql_query = \
SELECT \
id, name \
FROM artists;
#UNIX_TIMESTAMP(time)
#sql_attr_uint = group_id
#sql_attr_timestamp = time
sql_query_info = SELECT id,name FROM artists WHERE id=$id
}
index artists
{
source = artists
path = /var/sphinx/artists
docinfo = extern
charset_type = utf-8
}
Вам нужно использовать параметр конфигурации индекса min_prefix_len, чтобы сообщить sphinx, что вы хотите, чтобы он индексировал и соответствовал частичным словам. Возможно, вам также потребуется установить для enable_star значение 1
http://www.sphinxsearch.com/docs/current.html#conf-min-prefix-len
index artists
{
source = artists
path = /var/sphinx/artists
docinfo = extern
charset_type = utf-8
min_prefix_len = 2
enable_star = 1
}
после включения индексирования префиксов вы сможете ищите такие вещи, как "50 Ce *", чтобы получить частичные совпадения слов. Если вы хотите, чтобы частичное совпадение слов было разрешено, не требуя, чтобы ваши пользователи знали о добавлении * самих себя, вам, вероятно, придется программно изменить строку поиска, прежде чем передавать ее в sphinx.