Ошибка синтаксического анализа Yajl с потоком JSON githubarchive.org в Python

Я пытаюсь разобрать файл архива GitHub с помощью yajl -py. Я считаю, что основной формат файла представляет собой поток объектов JSON, поэтому сам файл не является допустимым JSON, но содержит объекты, которые являются.

Чтобы проверить это, я установил yajl-py, а затем использовал их пример парсера (из https://github.com/pykler/yajl-py/blob/master/examples/yajl_py_example.py), чтобы попытаться разобрать файл :

python yajl_py_example.py < 2012-03-12-0.json

, где 2012-03-12-0.json— один из архивных файлов GitHub, который был распакован.

Похоже, такие вещи должны работать из их эталонной реализации на Ruby. Пакеты Python не обрабатывают потоки JSON?

Кстати вот у меня выдает ошибку:

yajl.yajl_common.YajlError: parse error: trailing garbage
          9478bbc3","type":"PushEvent"}{"repository":{"url":"https://g
                     (right here) ------^

5
задан Bialecki 3 May 2012 в 13:28
поделиться