Капли категории из Dask DataFrame? [Дубликат]

Это все исчезнет, ​​если вы перезапишите свою службу для запуска w / bindService.

Пример того, как это сделать, можно увидеть по адресу: https://github.com/paulpv / ForegroundServiceAPI26 / tree / bound

Разница моей ветви «воспроизведения» можно увидеть по адресу: https://github.com/paulpv/ForegroundServiceAPI26/compare/repro .. .bound? расширить = 1

7
задан chrisfs 7 August 2015 в 00:47
поделиться

1 ответ

Мы реализовали метод drop в этого PR . Это доступно с dask 0.7.0.

In [1]: import pandas as pd

In [2]: df = pd.DataFrame({'x': [1, 2, 3], 'y': [3, 2, 1]})

In [3]: import dask.dataframe as dd

In [4]: ddf = dd.from_pandas(df, npartitions=2)

In [5]: ddf.drop('y', axis=1).compute()
Out[5]: 
   x
0  1
1  2
2  3

Раньше также можно было использовать нарезку с именами столбцов; хотя, конечно, это может быть менее привлекательным, если у вас много столбцов.

In [6]: ddf[['x']].compute()
Out[6]: 
   x
0  1
1  2
2  3
9
ответ дан MRocklin 21 August 2018 в 12:14
поделиться
  • 1
    Почему ".compute ()"? Если ваша база данных очень большая, разве это не замедляет вас? – FaCoffee 28 October 2017 в 15:59
  • 2
    Я использую только вычисление, чтобы показать результаты вычисления. Вы правы, что вызов вычисления преждевременно может быть субоптимальным. – MRocklin 29 October 2017 в 19:28
Другие вопросы по тегам:

Похожие вопросы: