Совпадение самого длинного префикса для URL-адресов

I нуждаются в информации о любом стандартном пакете питона, который может быть использован для «длинного префикса матч» на URL. Я просмотрел два стандартных пакета http://packages.python.org/PyTrie/#pytrie.StringTrie и 'http://pypi.python.org/pypi/trie/0.1.1' но они не кажутся полезными для задачи сопоставления самого длинного префикса в URL-адресах.

Например, если в моем наборе есть следующие URL-адреса 1-> http://www.google.com/mail, 2-> http://www.google.com/document, 3-> http: // www. facebook.com и т. д.

Теперь, если я ищу "http://www.google.com/doc", он должен вернуть 2, а поиск "http: //www.face" должен вернуть 3.

Я хотел подтвердить, существует ли какой-либо стандартный пакет python, который может помочь мне в этом, или я должен реализовать Trie для сопоставления префиксов.

Я не ищу решение, основанное на регулярных выражениях, поскольку оно не масштабируется по мере увеличения количества URL.

Большое спасибо.

10
задан Amit 27 March 2011 в 07:30
поделиться