3
ответа

Группировать по столбцу, другой столбец concatenate [duplicate]

Для следующего фрейма данных d = {'col1': [33,33,33,34,34,34], 'col2': ["hello", "hello1", "hello2", "hello3", "hello4" , "hello5"]} df = pd.DataFrame (data = d) print (d) Я хочу, чтобы он группировался по col1 и ...
вопрос задан: 6 March 2014 10:31
3
ответа

конвертирования кадра данных pandas, чтобы содержать список [duplicate]

Штат Год Количество месяцев 0 Алабама 2017,0 10,0 31 1 Алабама 2017,0 11,0 30 2 Алабама 2017,0 12,0 31 3 Алабама 2018,0 1,0 31 4 Алабама ...
вопрос задан: 6 March 2014 10:31
3
ответа

Объединить линию и гистограмму в Matplotlib [duplicate]

У меня есть временные ряды финансовых данных в Pandas DataFrame: Дата Закрыть Том 2003-09-01 8.24890 54344 2003-09-02 8.23245 76655 2003-09-03 8.22710 87655 Я бы ...
вопрос задан: 13 November 2013 01:01
3
ответа

Форматирование дат с помощью Pandas [duplicate]

У меня вопрос о датах форматирования в столбце в моем фреймворке. Я немного смущен, почему он не форматируется, поскольку я выполнял инструкции относительно использования pd.to_datetime ...
вопрос задан: 8 October 2013 20:57
3
ответа

Pandas: выбор строк для создания нового фрейма данных с использованием индекса [duplicate]

Простой вопрос. У меня есть dataframe, который выглядит так (call if df1): Страна 2016 2017 2018 США 1 2 3 CAN 4 5 6 MEX 7 5 6 ARG 9 3 5 GBR 5 8 2 У меня есть переменная, называемая странами, которая выглядит ...
вопрос задан: 3 October 2013 10:36
3
ответа

Каков наиболее эффективный способ обработки кадра данных pandas? [Дубликат]

Я знаю, что это, возможно, уже было задано, но я не мог найти вопросы / ответы (возможно, потому что я новичок в пандах). Итак, вот оно: Если бы я хотел вычислить новый столбец из панд ...
вопрос задан: 30 July 2013 15:53
3
ответа

Как извлечь час из серии [duplicate]

Я попытался извлечь час дня из колонки. Мои данные выглядят так: Unique Key Дата создания 32305299 2016-01-01 00:00:09 Какая 'Созданная дата' была серией: type (df ['Created Date'] ...
вопрос задан: 16 June 2013 16:40
3
ответа

Как сохранить изменения в кадре данных Pandas в новый файл с помощью pd.to_csv? [Дубликат]

Попытка использовать небольшой пример для объяснения моего случая: df = pd.DataFrame ([[1,1], [1,2], [1,3], [1,4]], columns = ['A', 'B']) d1 = df ['B']. Apply (lambda x: '{0: 0 & gt; 3}'. Format (x)) df ['B'] = d1 df.head () df.to_csv (...
вопрос задан: 5 June 2013 00:19
3
ответа

Переименование заголовков csv в пандах без записи всего файла для очень большого csv [duplicate]

Я пытаюсь импортировать csv в большой запрос google, но в схеме он не позволяет имена заголовков с пробелом. И у моего csv есть несколько заголовков с промежутками между ними. Проблема в том, что файл csv ...
вопрос задан: 30 April 2013 19:41
3
ответа

DataFrame с многомерными значениями [duplicate]

Я хочу создать DataFrame, который содержит не одномерные массивы в одном или нескольких столбцах. Это пример: array1 = numpy.array ([1,2]) array2 = numpy.array ([[1,2], [3,4]]) A B 1 [1, 2] ...
вопрос задан: 14 April 2013 10:24
3
ответа

Эквивалент MATLAB в Python для чтения двоичного файла [дубликат]

Пожалуйста, дайте мне код Pandas для чтения файла, который эквивалентен этому фрагменту кода для выполнения этого же в MATLAB: - id = fopen ('D: \ JRF \ Clean_data \ 959_45db', 'rt'); signal = fread (fid, 'float32'); % F -...
вопрос задан: 8 February 2013 16:15
3
ответа

pandas: создавать разные типы агрегации для одного и того же столбца [duplicate]

У меня есть следующий код, который отлично работает. df_1 = df.groupby (['team']) ['member']. apply (lambda x: x.tolist ()). reset_index () df_2 = df.groupby (['team']). agg ({ член ':'.. Количество '}) reset_index () переименовать (...
вопрос задан: 25 January 2013 22:26
3
ответа

Среднее среднее значение Pandas и stdev [duplicate]

Моя цель - вычислить среднее и стандартное отклонение разных образцов. Например, у меня есть df: Start End n Mean Dev abc x 54 47 5 abc x 45 42 4 abc ...
вопрос задан: 25 January 2013 22:26
3
ответа

groupby (). sum () в столбце, groupby (). mean () на другом [дубликат]

Мне было интересно, есть ли способ группировать данные и использовать .sum () в столбце и в то же время .mean () на другом. Например: value1 value2 index1 index2 ...
вопрос задан: 25 January 2013 22:26
3
ответа

Как группировать в python, но делать несколько вычислений для одного столбца [duplicate]

Допустим, у меня есть следующий код, который создает случайные числа только для примера. Получение группы выполняется нормально, если для каждого столбца выполняется только одно действие. Поэтому df сгруппирован по C и получает ...
вопрос задан: 25 January 2013 22:26
3
ответа

Как пройти через столбец dataframe panda, удалить строку и умножить значение как целое [duplicate]

Извинения за простоту этого вопроса - я новичок в Python и Pandas. Я работаю с файловой рамкой panda, приобретенной через библиотеку yahoo_finance. Я получаю несколько значений с помощью ...
вопрос задан: 8 January 2013 17:45
3
ответа

Matplotlib пунктирный стиль одной строки, а не другие [дублировать]

У меня есть рамка данных панд, которую я хотел бы построить. У меня есть несколько столбцов, и я хотел бы убедиться, что первая серия будет построена с пунктирной линией, а остальные будут твердыми. Вот ...
вопрос задан: 6 January 2013 04:30
3
ответа

Сброс индекса по столбцу «Дата» [дубликат]

У меня возникают проблемы при запуске .rolling (5) .mean () он вычисляет правильные строки, но я хочу только этого для каждого игрока. В настоящее время я переполняю строку, которая не имеет ничего общего с этим ...
вопрос задан: 21 December 2012 22:27
3
ответа

Группировка и сортировка по месяцам в фрейме данных [дубликат]

У меня есть dataframe с сокращенным месяцем, day_of_month и некоторыми дополнительными данными. Я пробую группу по месяцам и сортировке по месяцам. Но в итоге я получаю в алфавитном порядке. Апрель, ...
вопрос задан: 12 December 2012 13:54
3
ответа

Добавить Автоматический индекс индексирования индекса в Pandas Dataframe [дубликат]

У меня есть 2 x CSV, которые я загружаю в Pandas Dataframes. На данный момент кадры данных не имеют уникального поля id. Кто-нибудь знает хороший способ добавить автоматически увеличивающееся значение interger для каждой строки ...
вопрос задан: 28 August 2012 23:50
3
ответа

Частотная гистограмма / бар-диаграмма в Python из двух списков [дубликат]

Я изучал это в течение немного времени, и кажется, что нет простой реализации того, что я хочу сделать, что я бы предположил, это очень простая и общая идея. У меня есть два списка, отсортированные ...
вопрос задан: 30 April 2012 21:48
3
ответа

ре Python: Как я соответствую альфа-символу

Как я могу соответствовать альфа-символу регулярному выражению. Я хочу символ, который находится в \w, но не находится в \d. Я хочу это unicode совместимый вот почему, я не могу использовать [a-zA-Z].
вопрос задан: 15 January 2010 17:30
3
ответа

Как переместить все URL в svn:externals свойствах через репозиторий?

Мы находимся в процессе перемещения наших репозиториев SVN от одной машины до другого, и с ним прибудет новое доменное имя для нового repo. Проблема, что в репозитории, существует...
вопрос задан: 3 November 2009 14:03
2
ответа

Чтение данных из pyodbc в панд

Я запрашиваю базу данных SQL и хочу использовать панды для обработки данных. Однако я не уверен, как перемещать данные. Ниже мой вход и выход. импорт pyodbc импорт панд из панд импорт ...
вопрос задан: 21 May 2019 22:31
2
ответа

Более быстрый способ подсчитать общее вхождение значений в столбце списков в пандах?

У меня в столбце данных pandas есть столбец, который содержит большое количество списков меток: > > > data ['SPLIT']. head (10) 0 [33.23, 88.72, 38.93, E931.7, V09.0, 041.11, 5 ... 1 [99.04, 38.06, ...
вопрос задан: 14 April 2019 07:35
2
ответа

Панды получают совокупную сумму после группового

У меня есть этот фрейм данных: в основном каждая строка является транзакцией, выполняемой одним клиентом в день. Есть несколько транзакций одного и того же клиента в один и тот же день и в разные даты. Я бы хотел ...
вопрос задан: 13 April 2019 13:45
2
ответа

Как заполнить 0 в кадре данных панд с фиксированным номером индекса?

Я хочу использовать CNN для некоторой таблицы данных (dataframe или ndarray), но у меня есть разные данные строки в каждом индексе. Источник: mIndex valueA valueB ------ ------ -------- 1 111 10 1 ...
вопрос задан: 11 April 2019 09:36
2
ответа

Заполните пропущенные значения на основе другого столбца в панде DataFrame

Я работаю с Pandas и numpy. Для следующего фрейма данных давайте назовем его «data», для значений Borough с данными ['Borough'] == 'Unspecified', мне нужно использовать почтовый индекс в Zip Incident поле ...
вопрос задан: 2 April 2019 03:46
2
ответа

Как назначить значение столбцу для каждой строки в панде? [Дубликат]

Я пытался присвоить значение для каждой строки кадра данных, и я не смог этого сделать (я новичок в пандах), поэтому, если кто-то может помочь, я был бы очень благодарен! У меня есть два кадра данных. В ...
вопрос задан: 29 March 2019 16:32
2
ответа

Отформатируйте вывод в Pandas

У меня есть лист Excel: я прочитал его: импортировать панд как pd, импортировать numpy как np excel_file = 'test.xlsx' df = pd.read_excel (excel_file, sheet_name = 0) print (df), который он показывает: значение имени 0 a. ..
вопрос задан: 29 March 2019 10:25