Я работаю над совместным научным проектом, который состоит из нескольких скриптов Python (максимум 1M) и относительно большого набора данных (1,5 ГБ). Наборы данных тесно связаны со сценариями python, поскольку сами наборы данных являются наукой, а сценарии - простым интерфейсом для них.
Я использую Mercurial в качестве инструмента управления версиями, но я не знаю, какой хороший механизм для определить репозиторий. С точки зрения логистики имеет смысл связать их вместе, чтобы, клонировав репозиторий, вы получили весь пакет. С другой стороны, меня беспокоит инструмент управления версиями, работающий с большими объемами данных.
Есть ли чистый механизм для этого?