dataframe - список вопросов по программированию dataframe

2

ответа

Pandas - использовать loc для доступа к уровням индекса [duplicate]

У меня есть dataframe с 3 уровнями в индексе, который выглядит следующим образом: In: z.index.values [0] Out: ('AT', 'Paddy rice', 'M.EUR') Всего 9800 элементов в такой индекс, как например: ...

вопрос задан: 19 August 2016 19:15

2

ответа

Сортировка кадров данных [дубликат]

Я работаю над кадрами данных, используя pandas в python, у меня есть образец данных, который выглядит так: R S T Диапазон процентов 0 34 1234 67 0.78 76-100 1 4326 223 ...

python pandas dataframe

вопрос задан: 13 June 2016 10:44

2

ответа

как изменить часть «когда» части данных pyspark [duplicate]

Я хочу сгладить один столбец в Dataframe, как показано ниже: df.select (* caculate_gender (). Values ()) def caculate_gender (): return {'gender': ** F.when ((F.col ('gender' ) == 1 | F.col ('gender') == ...

apache-spark dataframe pyspark apache-spark-sql

вопрос задан: 8 June 2016 21:02

2

ответа

Добавить суффикс в столбцы в pandas dataframe [duplicate]

Как добавить лишние слова / символы ко всем столбцам фреймворка в Python 3.6 У меня есть кадр данных с 15 + столбцами & amp; Я хочу добавить слово «Код» в список всех столбцов, существующих в dataframe. & ...

python pandas dataframe

вопрос задан: 19 May 2016 01:15

2

ответа

Преобразование большой матрицы в набор данных путем пропуска ряда строк [дубликат]

Я запускал функцию rasterToPoints () на растре, и это дало мне большую матрицу (конечно, с тремя переменными). Как сделать набор данных из этой большой матрицы, включив элементы с каждого четвертого ...

r dataframe matrix

вопрос задан: 2 May 2016 18:35

2

ответа

В R, как Вы циклично выполняетесь по строкам кадра данных действительно быстро?

Предположим, что у Вас есть кадр данных со многими строками и многими столбцами. Столбцы имеют имена. Вы хотите получить доступ к строкам числом и столбцам по имени. Например, один (возможно медленный) способ циклично выполниться...

r performance dataframe iteration rows

вопрос задан: 29 April 2016 11:08

2

ответа

Как объединить два data.frames вместе в R, сославшись на справочную таблицу

Я пытаюсь объединить два data.frames вместе, на основе общего имени столбца в каждом из них назвал series_id. Вот мой оператор слияния: слияние (test_growth_series_LUT, test_growth_series, =...

r merge dataframe

вопрос задан: 11 April 2016 19:57

2

ответа

добавить несколько (+100) кадров данных pandas для создания данных (дубликат)

Я нашел это сообщение: одновременно добавляю несколько кадров данных pandas, я понимаю, как это работает: import numpy as np import pandas as pd dates = np.asarray (pd.date_range ('1/1/2000', периоды = 8)) df1 = pd ....

python pandas dataframe append

вопрос задан: 10 April 2016 05:42

2

ответа

Как объединить 2 строки в кадре данных? [Дубликат]

Я не могу объединить две строки вместе, которые находятся в образце данных. Вот пример таблицы: Чтобы уточнить: я не работаю с двумя кадрами данных, показанными на картинке. Я только работаю с ...

python pandas dataframe

вопрос задан: 10 April 2016 05:42

2

ответа

Передайте data.frame имя столбца функции

Я пытаюсь записать функцию для принятия data.frame (x) и столбца от него. Функция выполняет некоторые вычисления на x и более поздние возвраты другой data.frame. Я застреваю на лучших практиках...

r dataframe r-faq

вопрос задан: 15 March 2016 14:37

2

ответа

Получить максимальный столбец на основе значения другого столбца [duplicate]

Вот как выглядят мои данные csv: TagNumber, DatePaid, TotalPaid ABCD, 11/5/2017, $ 101 EFGH, 12/5/2017, $ 201 ABCD, 11/7/2017, $ 501 ABCD, 12/5/2017, $ 201 Я создаю dataframe, который будет группировать данные с помощью ...

python-3.x apache-spark dataframe pyspark spark-dataframe

вопрос задан: 25 February 2016 12:40

2

ответа

Как использовать значение non-column в UserDefinedFunction (UDF) для добавления столбца в DataFrame? [Дубликат]

У меня есть простой фреймворк, над которым я хочу работать: + --- + ---- + | идентификатор | имя | + --- + ---- + | 1 | | | 2 | б | | 3 | с | | 4 | d | | 5 | е | + --- + ---- + Я пытаюсь добавить еще один столбец на основе «id» ...

scala apache-spark dataframe user-defined-functions

вопрос задан: 22 February 2016 12:13

2

ответа

Преобразуйте объектом к кадру данных в R

Я использую функцией в R, чтобы нарубить кадр данных и применить функцию к различным частям, как это: pairwise.compare <-функция (x) {Nright <-... Nwrong <-... Ntied <-......

r dataframe aggregate

вопрос задан: 23 January 2016 10:50

2

ответа

Сворачивание кадра данных путем выбора одной строки на группу

Я пытаюсь свернуть кадр данных путем удаления всех кроме одной строки от каждой группы строк с идентичными значениями в конкретном столбце. Другими словами, первая строка от каждой группы. Например, я был бы...

r dataframe

вопрос задан: 23 January 2016 10:35

2

ответа

Доступ к Произвольным Столбцам от использования Кадра данных R с ()

Предположим, что у меня есть кадр данных со столбцом, имя которого хранится в переменной. Доступ к этому столбцу с помощью переменной является легкой нотацией скобки использования: df <-data.frame (= представитель (1, 10), B = представитель (...

r dataframe

вопрос задан: 23 January 2016 10:04

2

ответа

Выберите сначала 4 строки data.frame в R

Как может я выбирать первые 4 строки data.frame: Ответ Веса 1 Управление 59 0.0 2 Обработки 90 0.8 3 Обработки 47 0.1 4 Treamment 106 0.1 5...

r dataframe

вопрос задан: 19 January 2016 01:29

2

ответа

Как я могу проанализировать данные CSV из символьного вектора, чтобы извлечь кадр данных?

Функции read.table и read.csv в R используются для анализа файла или URL-адреса, содержащего данные с разделителями, и для создания фрейма данных R. Тем не менее, у меня уже есть символьный вектор, который содержит CSV ...

import-from-csv dataframe csv parsing r

вопрос задан: 3 December 2015 21:00

2

ответа

Что делает эти два кадра данных R не идентичными?

У меня есть два небольших кадра данных, this_tx и last_tx. Они каждым способом, которым я могу сказать, абсолютно идентичный. this_tx == last_tx приводит к кадру идентичных размеров, всего TRUE. this_tx %in %...

r dataframe comparison

вопрос задан: 3 December 2015 19:00

2

ответа

Значение Python DataFrame Groupby и Count для каждого класса [duplicate]

Я хочу подсчитать значения для класса foreach для столбца набора данных. Например, Col1 Col2 A Class1 A Class2 B Class2 B Class1 B Class2 C Class1 C Class2 C Class2 C Class1 How ...

python dataframe group-by pandas-groupby

вопрос задан: 21 October 2015 23:52

2

ответа

Загрузка данных Spark Data в драйвер [дубликат]

Представьте, что у нас есть некоторый val hiveTableDataFrame: DataFrame И я хочу передать строки этого фрейма данных в мою программу драйверов. Дело в том, что hiveTableDataFrame слишком велик, и я не могу использовать ...

scala apache-spark dataframe

вопрос задан: 6 October 2015 10:51

2

ответа

Преобразование строки XML Атрибуты к кадру данных как переменные [дубликат]

Я только начинаю, и я пытаюсь разобрать XML на фрейм данных. Я прочитал много примеров, но часть, с которой я борюсь, может быть связана с самим файлом XML. Мой XML структурирован ...

r xml dataframe xml-parsing

вопрос задан: 1 October 2015 21:06

2

ответа

Подзадайте фрейм данных в соответствии со значениями столбца [duplicate]

Я хочу подстроить фрейм данных в соответствии со значениями столбца в. Dataframe = pd.DataFrame (столбцы = ["timestamp", "id", "col1", "col2", "col3"], data = [[1 , "a", 1, 2, 3], ...

python pandas dataframe matplotlib

вопрос задан: 28 August 2015 07:24

2

ответа

Одновременно оптимизируйте обработку Spark [duplicate]

Я занимаюсь обработкой Spark на нескольких файлах. Обработка проста: чтение csv, выбор / фильтрация, а затем наложение на паркет. Я заметил, что: чтение всех файлов в одном фрейме данных ...

csv apache-spark dataframe optimization parquet

вопрос задан: 11 August 2015 16:52

2

ответа

Дублировать строки в dataframe на основе значения столбца [duplicate]

У меня есть задача, когда я хочу подготовить ввод для алгоритма кластеризации того же размера. Ввод содержит повторяющиеся строки для более важных наблюдений и важности важности ...

python pandas dataframe lambda

вопрос задан: 17 July 2015 22:06

2

ответа

Подмножество данных на основе значений в другом фрейме данных [дубликат]

У меня есть dataframe df1: df1 = pd.DataFrame ({'id': [1, 2, 3, 4, 5], 'date': [4, 5, 6, 7, 8], 'str': [ 'a', 'b', 'c', 'd', 'e']}) Я хочу извлечь ...

python pandas dataframe

вопрос задан: 1 June 2015 20:11

2

ответа

Как слить результат из & ldquo; Group-By & rdquo; с оригинальным фреймворком данных в Pandas [дубликат]

У меня есть dataframe с 9 столбцами и 89K строк. Мне нужно выполнить TF-IDF с 2 строковыми столбцами. emp-name text Однако конечный результат состоит только из чисел из Tf-idf ...

python pandas dataframe tf-idf

вопрос задан: 15 April 2015 04:13

2

ответа

Pandon Pandas Проверьте, является ли значение в Dataframe [дубликат]

Для любого, у кого есть опыт работы с Python и Pandas, я пытаюсь сравнить два файла данных (не равные индексы) и посмотреть, находится ли одно значение из столбца (studentID) в другом фрейме данных с помощью ...

python pandas dataframe

вопрос задан: 6 April 2015 20:39

2

ответа

Поиск среднего значения среди одинаковых значений в DataFrame [duplicate]

У меня есть фрейм данных с именем Merged, который выглядит следующим образом: Позиция Эффект Размер 3 0.541160 5 0.080264 5 0.067536 5 0.050464 5 0.000581 7 0.129583 7 ...

pandas dataframe group-by average mean

вопрос задан: 30 March 2015 12:12

2

ответа

Удалите столбцы из кадра данных, где ВСЕ значения являются NA

Я испытываю затруднения из-за кадра данных и не мог действительно решить тот вопрос сам: кадр данных имеет произвольные свойства как столбцы, и каждая строка представляет один набор данных. Вопрос: Как добраться...

r apply dataframe

вопрос задан: 5 March 2015 05:21

2

ответа

Как вычесть один столбец из другого блока данных с двумя столбцами в R [duplicate]

Я пытаюсь вычесть один столбец (alldata $ T3M.yld) из целого dataframe (alldata.index), который, если возможно, содержит два столбца на одном шаге. Как я могу это сделать? Я могу это сделать, R.index = alldata.index $ ...

arrays r dataframe

вопрос задан: 4 March 2015 16:32