Я заметил, что LSH, кажется, хороший способ найти похожие элементы с большими свойствами. Прочитав статью http://www.slaney.org/malcolm/yahoo/Slaney2008-LSHTutorial.pdf, я все еще растерялся ...
Я ищу облегченную библиотеку Java, которая поддерживает поиск ближайших соседей с помощью хэширования с учетом местоположения для почти одинаково распределенных данных в многомерном (в моем случае 32)наборе данных с расширением...
У меня есть «записи» (в основном строки CSV) с двумя именами и одним адресом. Мне нужно найти записи, которые похожи друг на друга: в основном имена и части адреса выглядят «одинаково», как будто они ...
Существуют ли относительно простые для понимания (и простые в реализации) примеры хеширования с учетом локальности на C / C ++ / Java / C #? Я хотел бы узнать больше о концепции и поэтому хочу попробовать ...