Я пытаюсь разобрать файл архива GitHub с помощью yajl -py. Я считаю, что основной формат файла представляет собой поток объектов JSON, поэтому сам файл не является допустимым JSON, но содержит объекты, которые являются.
Чтобы проверить это, я установил yajl-py
, а затем использовал их пример парсера (из https://github.com/pykler/yajl-py/blob/master/examples/yajl_py_example.py), чтобы попытаться разобрать файл :
python yajl_py_example.py < 2012-03-12-0.json
, где 2012-03-12-0.json
— один из архивных файлов GitHub, который был распакован.
Похоже, такие вещи должны работать из их эталонной реализации на Ruby. Пакеты Python не обрабатывают потоки JSON?
Кстати вот у меня выдает ошибку:
yajl.yajl_common.YajlError: parse error: trailing garbage
9478bbc3","type":"PushEvent"}{"repository":{"url":"https://g
(right here) ------^