Каков наилучший метод устранения неоднозначности местоположения для данных гео-имен?

Каков наилучший метод для устранения неоднозначности местоположения для данных геоименов?

Есть некоторые алгоритм подсчета очков для поиска geonames, но они не открывают его исходный код, и я не уверен, что они очень сложные. (например, для сома, ок. он возвращает озеро Сома в Канаде , в котором даже нет статьи в Википедии, вместо очень популярного Сома Нейрбохуд в Сан-Франциско )

Есть также некоторые работы, которые я нашел в Google Scholar, но они кажутся очень мелкими и похожими на мою эвристику, например, оценку по чему-то ( log (популяция) + 1000 * hasWikipedia (статья) + isCity100 + isCapital (10) ).

Моя область - статьи о путешествиях, поэтому моя функция оценки должна обеспечивать наиболее вероятные туристические места (города, достопримечательности (Диснейленд, колледж, Биг Бен)).

Знаете ли вы какую-либо важную статью в этой области или алгоритмы, используемые в процессе разработки картами Google, Yahoo, Bing или даже geonames?

5
задан yura 2 July 2012 в 18:35
поделиться