1
ответ

Создание списка из корреляционной матрицы в пандах

Я пытаюсь создать список (3 из самых высоких коррелированных выборов) из корреляционной матрицы. Допустим, у меня есть следующая матрица: A B C D E A 1,00 0,15 0,57 0,11 0,98 ...
вопрос задан: 15 January 2019 21:59
1
ответ

Какой самый быстрый способ перебрать список критериев фильтра для панд данных DataFrame и выполнить некоторые вычисления?

Я часто нахожу себя со списком фильтров, которые мне нужно применить к кадру данных pandas. Я применяю каждый фильтр и делаю некоторые вычисления, но это часто приводит к медленному коду. Я хотел бы оптимизировать ...
вопрос задан: 15 January 2019 19:11
1
ответ

Переберите несколько значений, чтобы заполнить NaNs в панде

Я знаю, что не могу заполнить NaN списком, как указано в документации для fillna. Что же тогда является предпочтительным способом использования списка значений для заполнения NaN? Желаемое поведение - пройти через ...
вопрос задан: 15 January 2019 18:41
1
ответ

Конвертировать нулевые значения в пустой массив в Spark DataFrame

У меня есть фрейм данных Spark, где один столбец является массивом целых чисел. Столбец обнуляется, потому что он исходит из левого внешнего соединения. Я хочу преобразовать все нулевые значения в пустой массив, чтобы я не ...
вопрос задан: 6 January 2019 17:54
1
ответ

Конвертировать список словарей в панду DataFrame

У меня есть список таких словарей: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00' , 'месяц': "февраль '}, ​​{' баллов ': 90,' время ':' 9:00 ',' месяц ':' январь '}, ​​{' ...
вопрос задан: 19 December 2018 12:13
1
ответ

R эквивалент SELECT DISTINCT для двух или более полей / переменных

Скажем, у меня есть датафрейм df с двумя или более столбцами, есть ли простой способ использовать unique () или другую функцию R для создания подмножества уникальных комбинаций из двух или более столбцов? Я знаю, что могу использовать sqldf () ...
вопрос задан: 30 November 2018 06:45
1
ответ

Как заменить значения NA нулями в кадре данных R?

У меня есть фрейм данных, и некоторые столбцы имеют значения NA. Как заменить эти значения NA на нули?
вопрос задан: 26 October 2018 13:47
1
ответ

Как проверить, является ли какое-либо значение NaN в Pandas DataFrame

В Python Pandas, как лучше всего проверить, имеет ли DataFrame одно (или более) значение NaN? Я знаю о функции pd.isnan, но она возвращает DataFrame логических значений для каждого элемента. Это ...
вопрос задан: 20 October 2018 11:05
1
ответ

Довольно распечатать всю серию Pandas / DataFrame

Я много работаю с Series и DataFrames на терминале. Значение по умолчанию __repr__ для серии возвращает уменьшенную выборку с некоторыми значениями заголовка и хвоста, но остальные отсутствуют. Есть ли встроенный способ ...
вопрос задан: 3 October 2018 02:53
1
ответ

Преобразовать столбец data.frame в вектор?

У меня есть кадр данных, например: a1 = c (1, 2, 3, 4, 5) а2 = с (6, 7, 8, 9, 10) а3 = с (11, 12, 13, 14, 15) aframe = data.frame (a1, a2, a3) Я пробовал следующее, чтобы преобразовать один из столбцов в вектор, ...
вопрос задан: 11 September 2018 06:34
1
ответ

Создать пустой data.frame

Я пытаюсь инициализировать data.frame без каких-либо строк. По сути, я хочу указать типы данных для каждого столбца и дать им имена, но в результате не нужно создавать никаких строк. Лучшее, что я смог ...
вопрос задан: 29 August 2018 10:31
1
ответ

Как перебирать строки в DataFrame в Pandas?

У меня есть DataFrame от pandas: импортировать панд как pd inp = [{'c1': 10, 'c2': 100}, {'c1': 11, 'c2': 110}, {'c1': 12, ' c2 ': 120}] df = pd.DataFrame (inp) print df Вывод: c1 c2 0 10 100 1 11 110 2 ...
вопрос задан: 24 August 2018 19:20
1
ответ

Преобразование столбцов DataFrame, содержащих кортежи в строки

У меня есть DataFrame, подобный следующему: ABCDEF 0 1 (10, 11) (a, b) abc () () 1 2 (10, 11) (a, b) def (2, 19) (j, k) 2 3 ...
вопрос задан: 14 July 2018 02:57
1
ответ

Создание столбцов из категориальных переменных со значениями из двух других столбцов в пандах

Исходный фреймворк Я хочу, чтобы он преобразуется в следующую структуру: Область | Ind3_2016 | Ind6_2016 | ... | Ind12_2016 | Ind3_2017 | Ind6_2017 | ... | Ind12_2017 ------- | --------- | --------- | --- | ---------- | -----. ..
вопрос задан: 13 July 2018 20:36
1
ответ

Разделение текста одного столбца на основе другого столбца в кадре данных Pandas

У меня есть два столбца в моем фреймворке данных: «Тема» и «Описание». Я пытаюсь очистить столбец «Описание», разделив данные на текст из столбца «Тема», поскольку он содержится во всех строках ...
вопрос задан: 13 July 2018 20:18
1
ответ

Значения суммы столбца на основе уникальных значений другого столбца

У меня есть кадр данных Column1 Column2 1 20 2 25 3 30 2 40 4 18 1 24, и я хочу суммировать Column2 на основе уникальных значений Column1. Мы можем ...
вопрос задан: 13 July 2018 17:37
1
ответ

json file schema / object для запуска схемы для загрузки данных

Мне нужно загружать много файлов в таблицы с помощью pySpark. Существует несколько разных json-файлов, содержащих данные и отдельные файлы, в которых определены схемы данных файлов. При загрузке файлов без ...
вопрос задан: 13 July 2018 16:37
1
ответ

Pandas Series.Shift усекает последнее значение

У меня есть серия из 35 значений с индексом от 0 до 34. Его набор, подобный этому (от 0 до 34 против 1 до 25), должен быть встроен в другие серии, которые я использую. Однако, когда я пытаюсь использовать функцию np.npv, она обрабатывает ...
вопрос задан: 13 July 2018 16:01
1
ответ

Используйте регулярные выражения для определения диапазона буквенно-цифровой строки

Мне нужна помощь с регулярными выражениями, чтобы сделать следующее. У меня есть список предметов исследования, которые называются: subject & lt; - c ('x-010', 'x-011', 'x-012', 'x-013', 'x-014', 'x -015 ',' x-016 ',' x-017 ',' x -...
вопрос задан: 13 July 2018 15:58
1
ответ

Python Pandas - используйте разделитель нескольких символов при записи to_csv

Похоже, что функция pandas to_csv допускает только разграничители / разделители символов. Есть ли способ разрешить использование строки символов, например, «::» или «%%»? Я пытался: ...
вопрос задан: 13 July 2018 15:28
1
ответ

Удалить & ldquo; NA & rdquo; из некоторых конкретных ячеек кадра данных. Не все из них

Таким образом, мои данные имеют следующий формат: A B C D E F 1 12 NA NA 28 NA NA 2 34 NA NA 29 NA 34 3 98 98 NA 90 NA 67 4 29 34 84 NA NA 67 5 84 NA 29 89 NA 45 ...
вопрос задан: 13 July 2018 15:17
1
ответ

Как перебирать столбцы верхнего уровня в мультизадаче pandas dataframe

У меня многокадровый файловый фрейм, и он выглядит так: SPY ARKW Open High Open High ...
вопрос задан: 13 July 2018 13:31
1
ответ

как добавить новую строку для каждого отдельного идентификатора в пандах?

У меня есть такой кадр данных: import pandas as pd df = pd.DataFrame ({'CarID': ['B332', 'B332', 'B332', 'C315', 'C315', 'C315', 'C315 ',' C315 ',' F310 ',' F310 '], \' Дата ': [' 2018-03 -...
вопрос задан: 13 July 2018 12:57
1
ответ

Извлечь вложенный массив из строки Spark SQL внутри UDF

Я работаю с DataFrames и нуждаюсь в извлечении данных. У меня много вложенных уровней, поэтому я сделал первый уровень с взрывами и выборами, но затем я использую UDF для вложенных уровней. У меня есть UDF, берущий $ Root ....
вопрос задан: 13 July 2018 11:46
1
ответ

Добавить строки для каждого значения словаря с дублированным ключом в следующем столбце

К сожалению, я борюсь со следующим планом: я вытащил большой словарь с именами пользователей в качестве ключей и последователями Instagram в качестве их значений. Это выглядит так: dict = {"User1": ...
вопрос задан: 13 July 2018 09:16
1
ответ

Как фильтр по дате (между двумя датами) с двумя столбцами в моем фрейме данных в pyspark

Я хочу отфильтровать мой df между двумя столбцами даты, например: + ------ + ---------- + ---------- + | код | Date1 | Дата2 | + ------ + ---------- + ---------- + | 10 | 2018-06-01 | 2018-06-05 | | 15 | 2018-06 -...
вопрос задан: 13 July 2018 09:10
1
ответ

Панды и запасы: от ежедневных значений (в столбцах) до ежемесячных значений (в строках)

У меня возникла проблема переформатирования данных. Мой ввод - это строки дневного значения по столбцам символов (каждый символ имеет разные даты с его значениями): Код ввода для генерации входных данных = [(«01-01-2010», ...
вопрос задан: 13 July 2018 08:14
1
ответ

Изменение столбца подмножества строк DataFrame

У меня есть DataFrame, как показано ниже: import pandas as pd df = pd.DataFrame (data = {'text': ['foo', '10 € ',' EUR5 ',' bar '],' x ': [1.1 , 2.2, 3.3, 4.4]}) текст x 0 foo 1.1 1 10 € 2.2 2 ...
вопрос задан: 13 July 2018 06:50
1
ответ

Подсчитайте дни между двумя датами в Dataframe и отсортируйте их по месяцам [duplicate]

Я хотел бы рассчитать дни между двумя датами (т. Е. 24 12 2018 - 05 01 2018). И один день только для тех, которые после запятой (т. Е. 24 12 2018 - 04 01 2018, 21 12 2018). Есть ли способ применить ...
вопрос задан: 14 May 2018 21:35
1
ответ

Как получить доступ к элементу DOM в React? Что эквивалентно document.getElementById () в React

Как выбрать определенные бары в Reaction.js? Это мой код: var Progressbar = React.createClass ({getInitialState: function () {return {complete: this.props.completed};}, ...
вопрос задан: 19 April 2018 07:22