Каков наилучший метод для устранения неоднозначности местоположения для данных геоименов?
Есть некоторые алгоритм подсчета очков для поиска geonames, но они не открывают его исходный код, и я не уверен, что они очень сложные. (например, для сома, ок.
он возвращает озеро Сома в Канаде
, в котором даже нет статьи в Википедии, вместо очень популярного Сома Нейрбохуд в Сан-Франциско
)
Есть также некоторые работы, которые я нашел в Google Scholar, но они кажутся очень мелкими и похожими на мою эвристику, например, оценку по чему-то ( log (популяция) + 1000 * hasWikipedia (статья) + isCity100 + isCapital (10)
).
Моя область - статьи о путешествиях, поэтому моя функция оценки должна обеспечивать наиболее вероятные туристические места (города, достопримечательности (Диснейленд, колледж, Биг Бен)).
Знаете ли вы какую-либо важную статью в этой области или алгоритмы, используемые в процессе разработки картами Google, Yahoo, Bing или даже geonames?