Есть хорошие базы данных фамилий?

Я хочу сгенерировать некоторые тестовые данные базы данных, в частности столбцы таблицы, содержащие имена людей. Чтобы получить хорошее представление о том, насколько хорошо работает индексация при поиске по имени, я хочу максимально приблизиться к реальным именам и их истинному частотному распределению, например много разных имен с частотами, распределенными по некоторому степенному закону распределения.

В идеале я ищу свободно доступный файл данных с именами, за которыми следует одно значение частоты (или, что эквивалентно, вероятность) для каждого имени.

Англо-саксонский основанные на основе имена были бы хороши, хотя имена из других культур также были бы полезны.

7
задан redcalx 1 July 2011 в 22:01
поделиться