Как аккуратно обрабатывать исходный код и данные в репозитории

Я работаю над совместным научным проектом, который состоит из нескольких скриптов Python (максимум 1M) и относительно большого набора данных (1,5 ГБ). Наборы данных тесно связаны со сценариями python, поскольку сами наборы данных являются наукой, а сценарии - простым интерфейсом для них.

Я использую Mercurial в качестве инструмента управления версиями, но я не знаю, какой хороший механизм для определить репозиторий. С точки зрения логистики имеет смысл связать их вместе, чтобы, клонировав репозиторий, вы получили весь пакет. С другой стороны, меня беспокоит инструмент управления версиями, работающий с большими объемами данных.

Есть ли чистый механизм для этого?

9
задан Martin Geisler 10 March 2012 в 11:34
поделиться