numpy recarray strings переменной длины

Можно ли инициализировать numpy recarray, который будет содержать строки, не зная заранее длины строк?

В качестве (надуманного) примера:

mydf = np.empty( (numrows,), dtype=[ ('file_name','STRING'), ('file_size_MB',float) ] )

Проблема в том, что я создаю свой recarray заранее заполнения его информацией, и я не обязательно заранее знаю максимальную длину имя_файла .

Все мои попытки приводят к усечению строкового поля:

>>> mydf = np.empty( (2,), dtype=[('file_name',str),('file_size_mb',float)] )
>>> mydf['file_name'][0]='foobarasdf.tif'
>>> mydf['file_name'][1]='arghtidlsarbda.jpg'
>>> mydf
array([('', 6.9164002347457e-310), ('', 9.9413127e-317)], 
      dtype=[('file_name', 'S'), ('file_size_mb', '>> mydf['file_name']
array(['f', 'a'], 
      dtype='|S1')

(Кстати, почему mydf ['file_name'] показывает 'f' и 'a', тогда как mydf показывает '' и ''?)

Точно так же, если я инициализирую с типом (скажем) | S10 для имя_файла , тогда все будет усечено до длины 10.

Единственный подобный вопрос, который я смог найти, - это этот , но он вычисляет соответствующую длину строки априори и, следовательно, не совсем такой же, как мой (так как я ничего не знаю заранее).

Есть ли какая-нибудь альтернатива, кроме инициализации имя_файла с помощью (например) | S9999999999999 (то есть какой-то нелепый верхний предел)?

17
задан Community 23 May 2017 в 12:32
поделиться