Панды: условное утверждение IF на колонке [дубликат]

Question

Панды: условное утверждение IF на колонке [дубликат]

Когда вы объявляете ссылочную переменную (т. е. объект), вы действительно создаете указатель на объект. Рассмотрим следующий код, в котором вы объявляете переменную примитивного типа int:

int x;
x = 10;

В этом примере переменная x является int, и Java инициализирует ее для 0. Когда вы назначаете его 10 во второй строке, ваше значение 10 записывается в ячейку памяти, на которую указывает x.

Но когда вы пытаетесь объявить ссылочный тип, произойдет что-то другое. Возьмите следующий код:

Integer num;
num = new Integer(10);

Первая строка объявляет переменную с именем num, но она не содержит примитивного значения. Вместо этого он содержит указатель (потому что тип Integer является ссылочным типом). Поскольку вы еще не указали, что указать на Java, он устанавливает значение null, что означает «Я ничего не указываю».

Во второй строке ключевое слово new используется для создания экземпляра (или создания ) объекту типа Integer и переменной указателя num присваивается этот объект. Теперь вы можете ссылаться на объект, используя оператор разыменования . (точка).

Exception, о котором вы просили, возникает, когда вы объявляете переменную, но не создавали объект. Если вы попытаетесь разыменовать num. Перед созданием объекта вы получите NullPointerException. В самых тривиальных случаях компилятор поймает проблему и сообщит вам, что «num не может быть инициализирован», но иногда вы пишете код, который непосредственно не создает объект.

Например, вы можете имеют следующий метод:

public void doSomething(SomeObject obj) {
   //do something to obj
}

В этом случае вы не создаете объект obj, скорее предполагая, что он был создан до вызова метода doSomething. К сожалению, этот метод можно вызвать следующим образом:

doSomething(null);

В этом случае obj имеет значение null. Если метод предназначен для того, чтобы что-то сделать для переданного объекта, целесообразно бросить NullPointerException, потому что это ошибка программиста, и программисту понадобится эта информация для целей отладки.

Альтернативно, там могут быть случаи, когда цель метода заключается не только в том, чтобы работать с переданным в объекте, и поэтому нулевой параметр может быть приемлемым. В этом случае вам нужно будет проверить нулевой параметр и вести себя по-другому. Вы также должны объяснить это в документации. Например, doSomething может быть записано как:

/**
  * @param obj An optional foo for ____. May be null, in which case 
  *  the result will be ____.
  */
public void doSomething(SomeObject obj) {
    if(obj != null) {
       //do something
    } else {
       //do something else
    }
}

Наконец, Как определить исключение & amp; причина использования Трассировки стека

144

pandas dataframe

задан Alex Riley 10 May 2015 в 17:10

5 ответов

Другой способ, которым это может быть достигнуто, -

df['color'] = df.Set.map( lambda x: 'red' if x == 'Z' else 'green')

15

ответ дан acharuva 20 August 2018 в 12:53
поделиться

Вот еще один способ обмануть этого кота, используя словарь для отображения новых значений на клавиши в списке:

def map_values(row, values_dict): return values_dict[row] values_dict = {'A': 1, 'B': 2, 'C': 3, 'D': 4} df = pd.DataFrame({'INDICATOR': ['A', 'B', 'C', 'D'], 'VALUE': [10, 9, 8, 7]}) df['NEW_VALUE'] = df['INDICATOR'].apply(map_values, args = (values_dict,))

Как это выглядит:

df Out[2]: INDICATOR VALUE NEW_VALUE 0 A 10 1 1 B 9 2 2 C 8 3 3 D 7 4

Этот подход может быть очень сильным, когда у вас есть много операторов ifelse -типов, чтобы сделать (то есть множество уникальных значений для замены).

И, конечно же, вы всегда можете это сделать:

df['NEW_VALUE'] = df['INDICATOR'].map(values_dict)

Но этот подход более чем в три раза медленнее, чем подход apply сверху, на моей машине.

И вы также можете сделать это, используя dict.get:

df['NEW_VALUE'] = [values_dict.get(v, None) for v in df['INDICATOR']]

11

ответ дан blacksite 20 August 2018 в 12:53
поделиться

1

– Monica Heddneck 21 June 2018 в 00:16

Ниже ниже, чем подходы здесь , но мы можем вычислить дополнительный столбец на основе содержимого более чем одного столбца, и для дополнительного столбца можно вычислить более двух значений.

Простой пример, используя только столбец «Установить»:

def set_color(row): if row["Set"] == "Z": return "red" else: return "green" df = df.assign(color=df.apply(set_color, axis=1)) print(df)

Set Type color 0 Z A red 1 Z B red 2 X B green 3 Y C green

Пример с учетом большего количества цветов и большего количества столбцов:

def set_color(row): if row["Set"] == "Z": return "red" elif row["Type"] == "C": return "blue" else: return "green" df = df.assign(color=df.apply(set_color, axis=1)) print(df)

Set Type color 0 Z A red 1 Z B red 2 X B green 3 Y C blue

9

ответ дан Community 20 August 2018 в 12:53
поделиться

Понимание списков - это еще один способ условного создания другого столбца. Если вы работаете с объектами dtypes в столбцах, как и в вашем примере, то, как правило, в большинстве случаев методы списка превосходят большинство других методов.

Пояснение списка примеров:

df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]

% тестов времени:

import pandas as pd import numpy as np df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')}) %timeit df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']] %timeit df['color'] = np.where(df['Set']=='Z', 'green', 'red') %timeit df['color'] = df.Set.map( lambda x: 'red' if x == 'Z' else 'green') 1000 loops, best of 3: 239 µs per loop 1000 loops, best of 3: 523 µs per loop 1000 loops, best of 3: 263 µs per loop

63

ответ дан stackoverflowuser2010 20 August 2018 в 12:53
поделиться

1

Обратите внимание, что с гораздо большими кадрами данных (думаю, pd.DataFrame({'Type':list('ABBC')*100000, 'Set':list('ZZXY')*100000}) -размер], numpy.where превосходит map, но понимание списка является королем (примерно на 50% быстрее, чем numpy.where). – blacksite 20 April 2017 в 16:45

Другие вопросы по тегам:
pandas dataframe

Похожие вопросы:

31
Установка pandas на python 3.6 (64 бит) становится неудачной [дубликат] - 3 October 2014 16:04

27
спрашивая о pandas dataframe относительно изменения имени столбца в нем [duplicate] - 12 December 2017 19:55

26
pandas pivot_table настроить порядок столбцов [дубликат] - 4 January 2013 08:09

25
Python: выбор различных элементов пересечения множеств [duplicate] - 29 April 2017 13:12

20
Ошибка записи данных в формате PySpark (данные MovieLens) [дубликат] - 22 March 2016 14:59

20
Добавить файл во время цикла в python [duplicate] - 25 August 2011 20:52

18
Как добавить выходные данные в формате строки в pandas dataframe [duplicate] - 31 August 2017 08:09

Обратите внимание, что с гораздо большими кадрами данных (думаю, pd.DataFrame({'Type':list('ABBC')*100000, 'Set':list('ZZXY')*100000}) -размер], numpy.where превосходит map, но понимание списка является королем (примерно на 50% быстрее, чем numpy.where). — blacksite, 20 April 2017 в 16:45

score 323 · Accepted Answer

df['color'] = np.where(df['Set']=='Z', 'green', 'red')

Например,

import pandas as pd
import numpy as np

df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
print(df)

дает

  Set Type  color
0   Z    A  green
1   Z    B  green
2   X    B    red
3   Y    C    red

Если у вас было больше условий, используйте np.select . Например, если вы хотите, чтобы цвет был

yellow, когда (df['Set'] == 'Z') & (df['Type'] == 'A')
в противном случае blue, когда (df['Set'] == 'Z') & (df['Type'] == 'B')
в противном случае purple, когда (df['Type'] == 'B')
в противном случае black,

затем используйте

df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})
conditions = [
    (df['Set'] == 'Z') & (df['Type'] == 'A'),
    (df['Set'] == 'Z') & (df['Type'] == 'B'),
    (df['Type'] == 'B')]
choices = ['yellow', 'blue', 'purple']
df['color'] = np.select(conditions, choices, default='black')
print(df)

, что дает

  Set Type   color
0   Z    A  yellow
1   Z    B    blue
2   X    B  purple
3   Y    C   black

323

ответ дан unutbu 20 August 2018 в 12:53

1

не может плюс один его достаточно. Настоящая строка с хлебом и маслом. – Matt O'Brien 21 September 2015 в 20:57
2

не работает, если я ставлю два условия внутри, где предложение с – Amol Sharma 18 January 2016 в 14:34
3

@AmolSharma: Используйте & вместо and. См. stackoverflow.com/q/13589390/190597 – unutbu 18 January 2016 в 15:10
4

df ['color'] = list (np.where (df ['Set'] == 'Z', 'green', 'red')) будет подавлять предупреждение pandas: значение пытается быть установлено на копии фрагмента из DataFrame. Попробуйте вместо этого использовать .loc [row_indexer, col_indexer] = значение – denson 19 October 2016 в 16:48
5

«зеленый» и «красный» также могут быть заменены на арифметику столбцов. например, , df['foo'] = np.where(df['Set']=='Z', df['Set'], df['Type'].shift(1)) – Alejandro 25 July 2017 в 18:26