Первый набор данных: эти игроки играют в турнире. Эти данные собирают игроков и команды. df_team = pd.DataFrame ({«Страна»: [«Индия», «Индия», «Индия», «AUS», «AUS», «AUS»], «Игрок»: [...
Dears, у меня есть проект от Udacity «Аналитик данных Nanodegree», в этом проекте я должен анализировать и исследовать данные IMDB, чтобы ответить на множество вопросов, которые были решены мной. кажется, все ...
Я хотел извлечь наименее коррелированные столбцы. Пример Excel приведен ниже: данные считываются в список. копирование и вставка возможны на вашем компьютере. data = [[1.0, 0.753392, 3.0, 0.725201], [2.0, 0 ....
У меня возникла проблема переформатирования данных. Мой ввод - это строки дневного значения по столбцам символов (каждый символ имеет разные даты с его значениями): Код ввода для генерации входных данных = [(«01-01-2010», ...
Эта часть кода помещает символы EΞ в столбец и при экспорте показывает? на их месте. import geandas dff ['KAEK'] = dff ['CAD']. str [: 5] .add ('ΕΞ'). add (dff ['CAD_AD_F']. str [5:]). add (dff [' ...
У меня есть DataFrame, как показано ниже: import pandas as pd df = pd.DataFrame (data = {'text': ['foo', '10 € ',' EUR5 ',' bar '],' x ': [1.1 , 2.2, 3.3, 4.4]}) текст x 0 foo 1.1 1 10 € 2.2 2 ...
from xgboost import plot_importance from matplotlib import pyplot plot_importance (model) pyplot.show () У меня есть 150 функций, встроенных в модель xgboost, и хочу распечатать все особенности, ...
У меня есть ряд временных осадков, например: rainfall 0 3.1 1 2 2 0 3 0 4 12 5 0 6 1 7 2 8 3 9 6 10 1 11 2 12 9 Я хотел использовать python pandas для Flag наблюдения, которое имеет ...
У меня есть такой кадр данных, как этот df. Вопрос в том, как я могу превратить каждые три столбца в один столбец? Например, поверните столбцы [2000-01, 2000-02, 2000-03] в 2000q1 и используйте эти три столбца ...
Мне нужно написать пользовательскую функцию GroupBy.Apply () для pyspark. Поэтому я сказал: Представляем Pandas UDF для PySpark. Как я уже сказал, я попытался - @pandas_udf (& lt; mydf & gt; .schema, PandasUDFType.GROUPED_MAP) ...
Код ниже преобразует excel в csv, но он изменяет заголовок столбца, добавляя .1. У меня есть несколько столбцов с одинаковым именем столбца, которое я хочу таким образом. Как я могу редактировать этот код, чтобы он сохранял ...
Я хотел бы рассчитать дни между двумя датами (т. Е. 24 12 2018 - 05 01 2018). И один день только для тех, которые после запятой (т. Е. 24 12 2018 - 04 01 2018, 21 12 2018). Есть ли способ применить ...
У меня очень длинный Pandas DataFrame (около 10K строк), но я предоставляю упрощенный DataFrame в качестве примера: df = pd.DataFrame ({«STUDENT»: [1, 2, 3, 4, 5], «SCHOOL»: [11, 11, ...
Я использую кодировщик меток для преобразования категориальных данных в числовые значения. Как LabelEncoder обрабатывает пропущенные значения? из sklearn.preprocessing import LabelEncoder импортировать панды как импорт pd ...
У меня есть CSV-файл следующим образом: 0 5 1 10 2 15 3 20 4 25 Я хочу сохранить его в качестве кадра данных с осями X, Y в качестве имен, а затем построить его. Однако когда я назначаю x, y я получаю испорченный DataFrame, что происходит? ...
У меня есть датафрейм в пандах, где каждый столбец имеет различный диапазон значений. Например: df: A B C 1000 10 0,5 765 5 0,35 800 7 0,09 Любая идея, как я могу нормализовать столбцы этого ...
В R, когда вам нужно получить индекс столбца, основанный на имени столбца, вы могли бы сделать idx < - which (names (my_data) == my_colum_name) Есть ли способ сделать то же самое с фреймами данных pandas?
У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хотел бы изменить имена столбцов в DataFrame A, где исходные имена столбцов: ...
Фон Я только что обновил свои панды с 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них выглядит так: E: \ FinReporter \ FM_EXT.py: 449: SettingWithCopyWarning: A ...
Я хочу изменить формат данных, который я хочу. У меня есть следующие данные. Код Дата закрытия 2007-06-01 600858 33.99 2007-06-04 600858 30.59 2007-06-05 600858 ...
Я хотел бы достичь следующего: #original df df_ori = pd.DataFrame ({'A': ['a', 'b', 'a', 'b'], 'B': ['c', ' d ',' c ',' d '],' C ': [' x ',' x ',' y ',' y '], ...
У меня есть файл excel, который я смог прочитать в dataframe pandas, используя pd.read_excel. Формат фрейма данных выглядит следующим образом: Recycle Num Raw Num Phr 0 Comp1 ...
У меня есть серия pandas с несколькими форматами месяцев, а также несколько разделителей. Как преобразовать его в метку времени в pandas, используя pandas.strftime ()? Предположим, что наша дата-серия - 11 апреля 1990 года ...
Я пытался найти ответ на этот вопрос в течение многих месяцев, изучая панд. Я использую SAS для своей повседневной работы, и он отлично подходит для поддержки из ядра. Однако SAS ужасен ...
У меня есть dataframe, x y z col 1 2 3 3 2 3 4 4 1 1 3 4 3 3 1 4 1 3 2 4 Итак, для каждой новой строки в «col» мне нужно найти максимум из первой строки ...
В настоящее время я использую PyCharm с Python версии 3.4.3 для этого конкретного проекта. Этот PyCharm ранее имел Python2.7, и я обновился до 3.4.3. Я пытаюсь получить данные из файла Excel, используя ...
import pandas as pd donor_df = pd.read_csv ('Election_Donor_Data.csv') top_donor = donor_df ['contb_receipt_amt']. copy () top_donor.sort () метод сортировки top_donor не применяется к top_donor, давая ...
Stack Members, я очень новичок в этом сайте, пожалуйста, несите меня для моего вопроса и формата :) У меня есть два файла - один CSV и один Excel (отсюда я должен искать) CSV выглядит следующим образом: aips ...