2
ответа

Pandas - использовать loc для доступа к уровням индекса [duplicate]

У меня есть dataframe с 3 уровнями в индексе, который выглядит следующим образом: In: z.index.values ​​[0] Out: ('AT', 'Paddy rice', 'M.EUR') Всего 9800 элементов в такой индекс, как например: ...
вопрос задан: 19 August 2016 19:15
2
ответа

Сортировка кадров данных [дубликат]

Я работаю над кадрами данных, используя pandas в python, у меня есть образец данных, который выглядит так: R S T Диапазон процентов 0 34 1234 67 0.78 76-100 1 4326 223 ...
вопрос задан: 13 June 2016 10:44
2
ответа

как изменить часть «когда» части данных pyspark [duplicate]

Я хочу сгладить один столбец в Dataframe, как показано ниже: df.select (* caculate_gender (). Values ​​()) def caculate_gender (): return {'gender': ** F.when ((F.col ('gender' ) == 1 | F.col ('gender') == ...
вопрос задан: 8 June 2016 21:02
2
ответа

Добавить суффикс в столбцы в pandas dataframe [duplicate]

Как добавить лишние слова / символы ко всем столбцам фреймворка в Python 3.6 У меня есть кадр данных с 15 + столбцами & amp; Я хочу добавить слово «Код» в список всех столбцов, существующих в dataframe. & ...
вопрос задан: 19 May 2016 01:15
2
ответа

Преобразование большой матрицы в набор данных путем пропуска ряда строк [дубликат]

Я запускал функцию rasterToPoints () на растре, и это дало мне большую матрицу (конечно, с тремя переменными). Как сделать набор данных из этой большой матрицы, включив элементы с каждого четвертого ...
вопрос задан: 2 May 2016 18:35
2
ответа

В R, как Вы циклично выполняетесь по строкам кадра данных действительно быстро?

Предположим, что у Вас есть кадр данных со многими строками и многими столбцами. Столбцы имеют имена. Вы хотите получить доступ к строкам числом и столбцам по имени. Например, один (возможно медленный) способ циклично выполниться...
вопрос задан: 29 April 2016 11:08
2
ответа

Как объединить два data.frames вместе в R, сославшись на справочную таблицу

Я пытаюсь объединить два data.frames вместе, на основе общего имени столбца в каждом из них назвал series_id. Вот мой оператор слияния: слияние (test_growth_series_LUT, test_growth_series, =...
вопрос задан: 11 April 2016 19:57
2
ответа

добавить несколько (+100) кадров данных pandas для создания данных (дубликат)

Я нашел это сообщение: одновременно добавляю несколько кадров данных pandas, я понимаю, как это работает: import numpy as np import pandas as pd dates = np.asarray (pd.date_range ('1/1/2000', периоды = 8)) df1 = pd ....
вопрос задан: 10 April 2016 05:42
2
ответа

Как объединить 2 строки в кадре данных? [Дубликат]

Я не могу объединить две строки вместе, которые находятся в образце данных. Вот пример таблицы: Чтобы уточнить: я не работаю с двумя кадрами данных, показанными на картинке. Я только работаю с ...
вопрос задан: 10 April 2016 05:42
2
ответа

Передайте data.frame имя столбца функции

Я пытаюсь записать функцию для принятия data.frame (x) и столбца от него. Функция выполняет некоторые вычисления на x и более поздние возвраты другой data.frame. Я застреваю на лучших практиках...
вопрос задан: 15 March 2016 14:37
2
ответа

Получить максимальный столбец на основе значения другого столбца [duplicate]

Вот как выглядят мои данные csv: TagNumber, DatePaid, TotalPaid ABCD, 11/5/2017, $ 101 EFGH, 12/5/2017, $ 201 ABCD, 11/7/2017, $ 501 ABCD, 12/5/2017, $ 201 Я создаю dataframe, который будет группировать данные с помощью ...
вопрос задан: 25 February 2016 12:40
2
ответа

Как использовать значение non-column в UserDefinedFunction (UDF) для добавления столбца в DataFrame? [Дубликат]

У меня есть простой фреймворк, над которым я хочу работать: + --- + ---- + | идентификатор | имя | + --- + ---- + | 1 | | | 2 | б | | 3 | с | | 4 | d | | 5 | е | + --- + ---- + Я пытаюсь добавить еще один столбец на основе «id» ...
вопрос задан: 22 February 2016 12:13
2
ответа

Преобразуйте объектом к кадру данных в R

Я использую функцией в R, чтобы нарубить кадр данных и применить функцию к различным частям, как это: pairwise.compare <-функция (x) {Nright <-... Nwrong <-... Ntied <-......
вопрос задан: 23 January 2016 10:50
2
ответа

Сворачивание кадра данных путем выбора одной строки на группу

Я пытаюсь свернуть кадр данных путем удаления всех кроме одной строки от каждой группы строк с идентичными значениями в конкретном столбце. Другими словами, первая строка от каждой группы. Например, я был бы...
вопрос задан: 23 January 2016 10:35
2
ответа

Доступ к Произвольным Столбцам от использования Кадра данных R с ()

Предположим, что у меня есть кадр данных со столбцом, имя которого хранится в переменной. Доступ к этому столбцу с помощью переменной является легкой нотацией скобки использования: df <-data.frame (= представитель (1, 10), B = представитель (...
вопрос задан: 23 January 2016 10:04
2
ответа

Выберите сначала 4 строки data.frame в R

Как может я выбирать первые 4 строки data.frame: Ответ Веса 1 Управление 59 0.0 2 Обработки 90 0.8 3 Обработки 47 0.1 4 Treamment 106 0.1 5...
вопрос задан: 19 January 2016 01:29
2
ответа

Как я могу проанализировать данные CSV из символьного вектора, чтобы извлечь кадр данных?

Функции read.table и read.csv в R используются для анализа файла или URL-адреса, содержащего данные с разделителями, и для создания фрейма данных R. Тем не менее, у меня уже есть символьный вектор, который содержит CSV ...
вопрос задан: 3 December 2015 21:00
2
ответа

Что делает эти два кадра данных R не идентичными?

У меня есть два небольших кадра данных, this_tx и last_tx. Они каждым способом, которым я могу сказать, абсолютно идентичный. this_tx == last_tx приводит к кадру идентичных размеров, всего TRUE. this_tx %in %...
вопрос задан: 3 December 2015 19:00
2
ответа

Значение Python DataFrame Groupby и Count для каждого класса [duplicate]

Я хочу подсчитать значения для класса foreach для столбца набора данных. Например, Col1 Col2 A Class1 A Class2 B Class2 B Class1 B Class2 C Class1 C Class2 C Class2 C Class1 How ...
вопрос задан: 21 October 2015 23:52
2
ответа

Загрузка данных Spark Data в драйвер [дубликат]

Представьте, что у нас есть некоторый val hiveTableDataFrame: DataFrame И я хочу передать строки этого фрейма данных в мою программу драйверов. Дело в том, что hiveTableDataFrame слишком велик, и я не могу использовать ...
вопрос задан: 6 October 2015 10:51
2
ответа

Преобразование строки XML Атрибуты к кадру данных как переменные [дубликат]

Я только начинаю, и я пытаюсь разобрать XML на фрейм данных. Я прочитал много примеров, но часть, с которой я борюсь, может быть связана с самим файлом XML. Мой XML структурирован ...
вопрос задан: 1 October 2015 21:06
2
ответа

Подзадайте фрейм данных в соответствии со значениями столбца [duplicate]

Я хочу подстроить фрейм данных в соответствии со значениями столбца в. Dataframe = pd.DataFrame (столбцы = ["timestamp", "id", "col1", "col2", "col3"], data = [[1 , "a", 1, 2, 3], ...
вопрос задан: 28 August 2015 07:24
2
ответа

Одновременно оптимизируйте обработку Spark [duplicate]

Я занимаюсь обработкой Spark на нескольких файлах. Обработка проста: чтение csv, выбор / фильтрация, а затем наложение на паркет. Я заметил, что: чтение всех файлов в одном фрейме данных ...
вопрос задан: 11 August 2015 16:52
2
ответа

Дублировать строки в dataframe на основе значения столбца [duplicate]

У меня есть задача, когда я хочу подготовить ввод для алгоритма кластеризации того же размера. Ввод содержит повторяющиеся строки для более важных наблюдений и важности важности ...
вопрос задан: 17 July 2015 22:06
2
ответа

Подмножество данных на основе значений в другом фрейме данных [дубликат]

У меня есть dataframe df1: df1 = pd.DataFrame ({'id': [1, 2, 3, 4, 5], 'date': [4, 5, 6, 7, 8], 'str': [ 'a', 'b', 'c', 'd', 'e']}) Я хочу извлечь ...
вопрос задан: 1 June 2015 20:11
2
ответа

Как слить результат из & ldquo; Group-By & rdquo; с оригинальным фреймворком данных в Pandas [дубликат]

У меня есть dataframe с 9 столбцами и 89K строк. Мне нужно выполнить TF-IDF с 2 строковыми столбцами. emp-name text Однако конечный результат состоит только из чисел из Tf-idf ...
вопрос задан: 15 April 2015 04:13
2
ответа

Pandon Pandas Проверьте, является ли значение в Dataframe [дубликат]

Для любого, у кого есть опыт работы с Python и Pandas, я пытаюсь сравнить два файла данных (не равные индексы) и посмотреть, находится ли одно значение из столбца (studentID) в другом фрейме данных с помощью ...
вопрос задан: 6 April 2015 20:39
2
ответа

Поиск среднего значения среди одинаковых значений в DataFrame [duplicate]

У меня есть фрейм данных с именем Merged, который выглядит следующим образом: Позиция Эффект Размер 3 0.541160 5 0.080264 5 0.067536 5 0.050464 5 0.000581 7 0.129583 7 ...
вопрос задан: 30 March 2015 12:12
2
ответа

Удалите столбцы из кадра данных, где ВСЕ значения являются NA

Я испытываю затруднения из-за кадра данных и не мог действительно решить тот вопрос сам: кадр данных имеет произвольные свойства как столбцы, и каждая строка представляет один набор данных. Вопрос: Как добраться...
вопрос задан: 5 March 2015 05:21
2
ответа

Как вычесть один столбец из другого блока данных с двумя столбцами в R [duplicate]

Я пытаюсь вычесть один столбец (alldata $ T3M.yld) из целого dataframe (alldata.index), который, если возможно, содержит два столбца на одном шаге. Как я могу это сделать? Я могу это сделать, R.index = alldata.index $ ...
вопрос задан: 4 March 2015 16:32