1
ответ

В python Dataframe, как добавить несколько строк, связанных с одной строкой в ​​другой фреймворк данных, в качестве дополнительных столбцов?

Первый набор данных: эти игроки играют в турнире. Эти данные собирают игроков и команды. df_team = pd.DataFrame ({«Страна»: [«Индия», «Индия», «Индия», «AUS», «AUS», «AUS»], «Игрок»: [...
вопрос задан: 13 July 2018 09:11
1
ответ

исследования с множественной переменной (2d) в пандах

Dears, у меня есть проект от Udacity «Аналитик данных Nanodegree», в этом проекте я должен анализировать и исследовать данные IMDB, чтобы ответить на множество вопросов, которые были решены мной. кажется, все ...
вопрос задан: 13 July 2018 08:58
1
ответ

Как я могу извлечь наименее коррелированные столбцы?

Я хотел извлечь наименее коррелированные столбцы. Пример Excel приведен ниже: данные считываются в список. копирование и вставка возможны на вашем компьютере. data = [[1.0, 0.753392, 3.0, 0.725201], [2.0, 0 ....
вопрос задан: 13 July 2018 08:22
1
ответ

Панды и запасы: от ежедневных значений (в столбцах) до ежемесячных значений (в строках)

У меня возникла проблема переформатирования данных. Мой ввод - это строки дневного значения по столбцам символов (каждый символ имеет разные даты с его значениями): Код ввода для генерации входных данных = [(«01-01-2010», ...
вопрос задан: 13 July 2018 08:14
1
ответ

Экспортировать файл с utf 8 для неанглийских символов в Python?

Эта часть кода помещает символы EΞ в столбец и при экспорте показывает? на их месте. import geandas dff ['KAEK'] = dff ['CAD']. str [: 5] .add ('ΕΞ'). add (dff ['CAD_AD_F']. str [5:]). add (dff [' ...
вопрос задан: 13 July 2018 07:31
1
ответ

Изменение столбца подмножества строк DataFrame

У меня есть DataFrame, как показано ниже: import pandas as pd df = pd.DataFrame (data = {'text': ['foo', '10 € ',' EUR5 ',' bar '],' x ': [1.1 , 2.2, 3.3, 4.4]}) текст x 0 foo 1.1 1 10 € 2.2 2 ...
вопрос задан: 13 July 2018 06:50
1
ответ

matplotlib: как показать все функции (около 150 единиц) четко

from xgboost import plot_importance from matplotlib import pyplot plot_importance (model) pyplot.show () У меня есть 150 функций, встроенных в модель xgboost, и хочу распечатать все особенности, ...
вопрос задан: 13 July 2018 06:43
1
ответ

(i + 1) больше, чем (i) для всех i в окне 4 (предыдущие чтения)

У меня есть ряд временных осадков, например: rainfall 0 3.1 1 2 2 0 3 0 4 12 5 0 6 1 7 2 8 3 9 6 10 1 11 2 12 9 Я хотел использовать python pandas для Flag наблюдения, которое имеет ...
вопрос задан: 13 July 2018 05:28
1
ответ

Объедините столбцы и вычислите их средний [дубликат]

У меня есть такой кадр данных, как этот df. Вопрос в том, как я могу превратить каждые три столбца в один столбец? Например, поверните столбцы [2000-01, 2000-02, 2000-03] в 2000q1 и используйте эти три столбца ...
вопрос задан: 4 July 2018 13:56
1
ответ

Как & lt; MyDataFrame & gt; GroupBy (& ldquo; Fields & rdquo;). Применить (Fn)? [Дубликат]

Мне нужно написать пользовательскую функцию GroupBy.Apply () для pyspark. Поэтому я сказал: Представляем Pandas UDF для PySpark. Как я уже сказал, я попытался - @pandas_udf (& lt; mydf & gt; .schema, PandasUDFType.GROUPED_MAP) ...
вопрос задан: 28 June 2018 13:44
1
ответ

Как получить исходные имена столбцов при преобразовании excel в csv в python? [Дубликат]

Код ниже преобразует excel в csv, но он изменяет заголовок столбца, добавляя .1. У меня есть несколько столбцов с одинаковым именем столбца, которое я хочу таким образом. Как я могу редактировать этот код, чтобы он сохранял ...
вопрос задан: 15 May 2018 15:34
1
ответ

Подсчитайте дни между двумя датами в Dataframe и отсортируйте их по месяцам [duplicate]

Я хотел бы рассчитать дни между двумя датами (т. Е. 24 12 2018 - 05 01 2018). И один день только для тех, которые после запятой (т. Е. 24 12 2018 - 04 01 2018, 21 12 2018). Есть ли способ применить ...
вопрос задан: 14 May 2018 21:35
1
ответ

Вставьте дополнительные столбцы в группу pandas [duplicate]

У меня очень длинный Pandas DataFrame (около 10K строк), но я предоставляю упрощенный DataFrame в качестве примера: df = pd.DataFrame ({«STUDENT»: [1, 2, 3, 4, 5], «SCHOOL»: [11, 11, ...
вопрос задан: 14 March 2018 02:55
1
ответ

кодировщик меток, кодирующий пропущенные значения

Я использую кодировщик меток для преобразования категориальных данных в числовые значения. Как LabelEncoder обрабатывает пропущенные значения? из sklearn.preprocessing import LabelEncoder импортировать панды как импорт pd ...
вопрос задан: 15 February 2018 15:28
1
ответ

read_csv неправильно читает имена столбцов в этом файле?

У меня есть CSV-файл следующим образом: 0 5 1 10 2 15 3 20 4 25 Я хочу сохранить его в качестве кадра данных с осями X, Y в качестве имен, а затем построить его. Однако когда я назначаю x, y я получаю испорченный DataFrame, что происходит? ...
вопрос задан: 5 February 2018 00:49
1
ответ

Нормализовать столбцы панд данных

У меня есть датафрейм в пандах, где каждый столбец имеет различный диапазон значений. Например: df: A B C 1000 10 0,5 765 5 0,35 800 7 0,09 Любая идея, как я могу нормализовать столбцы этого ...
вопрос задан: 2 February 2018 15:03
1
ответ

Получить индекс столбца из имени столбца в Python Pandas

В R, когда вам нужно получить индекс столбца, основанный на имени столбца, вы могли бы сделать idx < - which (names (my_data) == my_colum_name) Есть ли способ сделать то же самое с фреймами данных pandas?
вопрос задан: 19 December 2017 02:56
1
ответ

Переименование столбцов в пандах

У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хотел бы изменить имена столбцов в DataFrame A, где исходные имена столбцов: ...
вопрос задан: 12 December 2017 18:55
1
ответ

Как бороться с SettingWithCopyWarning в Pandas?

Фон Я только что обновил свои панды с 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них выглядит так: E: \ FinReporter \ FM_EXT.py: 449: SettingWithCopyWarning: A ...
вопрос задан: 1 December 2017 16:15
1
ответ

Как изменить желаемый формат DataFrame? [Дубликат]

Я хочу изменить формат данных, который я хочу. У меня есть следующие данные. Код Дата закрытия 2007-06-01 600858 33.99 2007-06-04 600858 30.59 2007-06-05 600858 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Преобразование строк в столбцы и одно горячее кодирование в Pandas [duplicate]

У меня есть dataframe вот так: customer_id | дата | категория 1 | 2017-2-1 | игрушки 2 | 2017-2-1 | питание 1 | 2017-2-1 | напитки 3 | 2017-2-2 | компьютер 2 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Pandas: расширение столбцов из значений в столбце [дубликат]

Я хотел бы достичь следующего: #original df df_ori = pd.DataFrame ({'A': ['a', 'b', 'a', 'b'], 'B': ['c', ' d ',' c ',' d '],' C ': [' x ',' x ',' y ',' y '], ...
вопрос задан: 13 November 2017 07:20
1
ответ

Организация данных в Pandas - альтернативы OneHot [дубликат]

У меня есть файл excel, который я смог прочитать в dataframe pandas, используя pd.read_excel. Формат фрейма данных выглядит следующим образом: Recycle Num Raw Num Phr 0 Comp1 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Как преобразовать дату в метку времени в пандах с несколькими разделителями и форматировать? [Дубликат]

У меня есть серия pandas с несколькими форматами месяцев, а также несколько разделителей. Как преобразовать его в метку времени в pandas, используя pandas.strftime ()? Предположим, что наша дата-серия - 11 апреля 1990 года ...
вопрос задан: 7 November 2017 10:09
1
ответ

& ldquo; Большие данные & rdquo; рабочие потоки с использованием панд

Я пытался найти ответ на этот вопрос в течение многих месяцев, изучая панд. Я использую SAS для своей повседневной работы, и он отлично подходит для поддержки из ядра. Однако SAS ужасен ...
вопрос задан: 22 September 2017 17:44
1
ответ

Python находит максимальное значение до текущей строки, фиксируя первую строку [дубликат]

У меня есть dataframe, x y z col 1 2 3 3 2 3 4 4 1 1 3 4 3 3 1 4 1 3 2 4 Итак, для каждой новой строки в «col» мне нужно найти максимум из первой строки ...
вопрос задан: 25 August 2017 10:53
1
ответ

ImportError: нет модуля с именем 'xlrd'

В настоящее время я использую PyCharm с Python версии 3.4.3 для этого конкретного проекта. Этот PyCharm ранее имел Python2.7, и я обновился до 3.4.3. Я пытаюсь получить данные из файла Excel, используя ...
вопрос задан: 21 July 2017 18:15
1
ответ

Получить индекс строки кадра данных панд в виде целого числа

Предположим, что простой кадр данных, например, A B 0 1 0,810743 1 2 0,595866 2 3 0,154888 3 4 0,472721 4 5 0,894525 5 6 0,978174 6 7 0,859449 7 8 0,541247 8 9 0,232302 9 ...
вопрос задан: 20 June 2017 21:15
1
ответ

Ошибка: объект «Серии» не имеет атрибута «sort» [duplicate]

import pandas as pd donor_df = pd.read_csv ('Election_Donor_Data.csv') top_donor = donor_df ['contb_receipt_amt']. copy () top_donor.sort () метод сортировки top_donor не применяется к top_donor, давая ...
вопрос задан: 23 May 2017 00:30
1
ответ

Поиск данных между excel и csv файлом python - как vlookup [duplicate]

Stack Members, я очень новичок в этом сайте, пожалуйста, несите меня для моего вопроса и формата :) У меня есть два файла - один CSV и один Excel (отсюда я должен искать) CSV выглядит следующим образом: aips ...
вопрос задан: 11 May 2017 07:49