Используйте значения в столбце для извлечения значений в нескольких столбцах в pandas [duplicate]

В Java все переменные, которые вы объявляете, на самом деле являются «ссылками» на объекты (или примитивы), а не самими объектами.

При попытке выполнить один метод объекта , ссылка просит живой объект выполнить этот метод. Но если ссылка ссылается на NULL (ничего, нуль, void, nada), то нет способа, которым метод будет выполнен. Тогда runtime сообщит вам об этом, выбросив исключение NullPointerException.

Ваша ссылка «указывает» на нуль, таким образом, «Null -> Pointer».

Объект живет в памяти виртуальной машины пространство и единственный способ доступа к нему - использовать ссылки this. Возьмем этот пример:

public class Some {
    private int id;
    public int getId(){
        return this.id;
    }
    public setId( int newId ) {
        this.id = newId;
    }
}

И в другом месте вашего кода:

Some reference = new Some();    // Point to a new object of type Some()
Some otherReference = null;     // Initiallly this points to NULL

reference.setId( 1 );           // Execute setId method, now private var id is 1

System.out.println( reference.getId() ); // Prints 1 to the console

otherReference = reference      // Now they both point to the only object.

reference = null;               // "reference" now point to null.

// But "otherReference" still point to the "real" object so this print 1 too...
System.out.println( otherReference.getId() );

// Guess what will happen
System.out.println( reference.getId() ); // :S Throws NullPointerException because "reference" is pointing to NULL remember...

Это важно знать - когда больше нет ссылок на объект (в пример выше, когда reference и otherReference оба указывают на null), тогда объект «недоступен». Мы не можем работать с ним, поэтому этот объект готов к сбору мусора, и в какой-то момент VM освободит память, используемую этим объектом, и выделит другую.

10
задан AtotheSiv 19 September 2014 в 14:43
поделиться

2 ответа

Вы создаете функцию поиска и вызываете apply в строке данных по строке, это не очень эффективно для больших dfs, хотя

In [245]:

def lookup(x):
    return x[x.best]
df['value'] = df.apply(lambda row: lookup(row), axis=1)
df
Out[245]:
   Date best   a  b   c   d  value
0  1990    a   5  4   7   2      5
1  1991    c  10  1   2   0      2
2  1992    d   2  1   4  12     12
3  1993    a   5  8  11   6      5
4
ответ дан EdChum 20 August 2018 в 10:48
поделиться
  • 1
  • 2
    @ 3kstc в основном мы используем apply для итерации по строкам, передавая arg axis=1, поэтому лямбда здесь является строкой, поэтому для первой строки x является первой строкой, затем мы возвращаем конкретный столбец, который в этом случае будет значение best для индексации этой строки – EdChum 15 November 2016 в 10:57

Существует встроенная функция lookup , которая может обрабатывать этот тип ситуации (смотрит по строке / столбцу). Я не знаю, насколько он оптимизирован, но может быть быстрее, чем применяемое решение.

In [9]: df['value'] = df.lookup(df.index, df['best'])

In [10]: df
Out[10]: 
   Date best   a  b   c   d  value
0  1990    a   5  4   7   2      5
1  1991    c  10  1   2   0      2
2  1992    d   2  1   4  12     12
3  1993    a   5  8  11   6      5
6
ответ дан Ogaga Uzoh 20 August 2018 в 10:48
поделиться
  • 1
    На наборе данных игрушки применяется 470us, поиск занимает 531us – EdChum 19 September 2014 в 14:59
  • 2
    Хм по какой-то причине timeit получает ошибку памяти, когда я пытаюсь это сделать даже на скромном размере df, скажем, 4000 строк, для 400 строк я получаю 8.17ms с использованием apply и 3.05ms с помощью lookup, поэтому я ожидаю, что поиск масштабируется лучше – EdChum 19 September 2014 в 15:04
  • 3
    Поиск может быть предпочтительным из-за более простого синтаксиса, но оба отлично работают, THX ребята! – AtotheSiv 20 September 2014 в 09:34
Другие вопросы по тегам:

Похожие вопросы: