i am looking for a source of huge data sets to test some graph algrothm implemention. The files should be in an easy to read file format somthing like:
$Node1
Node23
Node322334
Node43432
$Node2:
Node232
...
Thanks,
Chris
Вы не рассматривали возможность использования Graph API Facebook? Он предоставляет данные в формате JSON, поэтому его очень легко читать, и он должен предоставлять несколько больших графиков в зависимости от того, какие данные вы запрашиваете.
Быстрый лайфхак:
def generateGraph(n=100, avgNeigbors=10):
from random import randint
for i in range(n):
print "$"+str(i)
for m in range(avgNeigbors-randint(-avgNeigbors/2,avgNeigbors/2)):
print (randint(0,n))
Я нашел это, которое может содержать или не содержать то, что вам нужно:
http://people.sc.fsu.edu/~jburkardt/datasets/graffiti/graffiti.html
http://people. sc.fsu.edu/~jburkardt/datasets/sgb/sgb.html
Если вы разместите свой вопрос на https://math.stackexchange.com/ или на https:// cstheory.stackexchange.com/ вы можете привлечь внимание теоретиков алгоритмических графов или ученых-компьютерщиков, специализирующихся на алгоритмах графов.
Разместите ссылку здесь, если вы опубликуете свой вопрос повторно, поскольку меня немного интересует, где можно получить такой набор данных. Спасибо.
Набор данных IMDB можно использовать бесплатно (не в коммерческих целях!), который можно загрузить в виде простых текстовых файлов. Это огромно: сотни мегабайт необработанного текста, из которого можно построить график.