Я считаю, что одной из основных причин, по которой мне это нужно, является разделение путей файла на обоих /
и \
. Это немного сложное регулярное выражение, поэтому я отправлю его здесь для справки:
var splitFilePath = filePath.split(/[\/\\]/);
Когда вы назначаете свой список в серию, создается новый массив NumPy. Эта структура данных допускает векторизованные вычисления для числовых типов. Такие серии выложены в смежных блоках памяти. См. . Почему NumPy вместо списков Python? для более подробной информации.
Поэтому вам понадобится достаточно памяти для хранения дублированных данных. Это неизбежно. Невозможно «преобразовать» список в ряд Pandas на месте.
Примечание: приведенное выше не относится к тому, что происходит, когда вы назначаете массив NumPy ряду.
float
илиint
, а в списке Python. – jpp 13 July 2018 в 17:21a = np.arange(10)
;df = pd.DataFrame(a)
;a[0] = 15
– roganjosh 13 July 2018 в 17:22a
здесь не список! – jpp 13 July 2018 в 17:22