В чем преимущество сохранения файлов `.npz` вместо` .npy` в python, относительно скорости, памяти и поиска?

Вы должны сделать это так, как вы описали. MongoDB является нереляционной базой данных и не поддерживает объединения.

0
задан SuperCiocia 17 January 2019 в 15:01
поделиться

1 ответ

Основным преимуществом является то, что массивы загружаются лениво. То есть, если у вас есть файл npz с 100 массивами, вы можете загрузить файл без фактической загрузки каких-либо данных. Если вы запрашиваете один массив, загружаются только данные для этого массива.

Недостатком файлов npz является то, что они не могут отображаться в памяти (используя load(<file>, mmap_mode='r')), поэтому для больших массивов они могут быть не лучшим выбором. Для данных, где массивы имеют общую форму, я бы посоветовал взглянуть на структурированные массивы . Они могут быть отображены в память, разрешать доступ к данным с помощью dict-подобного синтаксиса (то есть, arr['field']) и очень эффективны в отношении памяти.

0
ответ дан user2699 17 January 2019 в 15:01
поделиться
Другие вопросы по тегам:

Похожие вопросы: