0
ответов

Почему категоризация Dask DataFrame, созданного из файла Parquet, резко увеличивает его размер?

Вот архетипический сценарий: я создаю Dask DataFrame из набора файлов Parquet, написанных FastParquet, и запускаю categoryorize () для DataFrame. Довольно много категорий становятся вновь «известными». Я ...
вопрос задан: 22 March 2019 17:18