Есть ли реализация идея описана в «Обнаружении близких дубликатов для веб-сканирования»

Статья: http://www2007.org/papers/paper215. pdf

Мне просто интересно, есть ли какие-нибудь реализации главы 3 этой статьи. Я имею в виду запросы к большим наборам данных, а НЕ только к simhash (легко найти реализации simhash).

Спасибо ~

9
задан Peter O. 19 October 2011 в 20:25
поделиться