1
ответ

Python / Pandas: сложные SUMIFS в Excel на разных фреймах

Я работаю с двумя фреймами данных, один из которых называется «Продажи», изображенный здесь, а другой - «Претензии», который изображен здесь.
вопрос задан: 19 February 2019 20:48
1
ответ

Преобразуйте продольные данные с переменными времени из широкого в длинный формат в r

У меня есть продольные данные с несколькими измерениями на ряде объектов с течением времени. Данные представлены в длинном формате с сотнями переменных и падежей: Id Time1 Measurement11 ... Time2 ...
вопрос задан: 19 February 2019 15:02
1
ответ

Как получить гистограмму для фрейма данных временных рядов панд с помощью Bokeh?

Я пытаюсь получить гистограмму данных временных рядов, как в следующем примере: из bokeh.io import show, output_file из bokeh.models import ColumnDataSource, FactorRange из bokeh ....
вопрос задан: 19 February 2019 05:48
1
ответ

Добавление таблицы на другой стол, чтобы они продолжали

У меня есть DataFrame с 10 строками, и я хочу добавить еще три таблицы к этим 10 строкам, чтобы они продолжались одна за другой. Следующая таблица начинается с 11 и третьего 21-го. Это ...
вопрос задан: 17 February 2019 16:50
1
ответ

Как указать матрицу предиктора для блока данных stan?

Уважаемое сообщество stackoverflow. Я хочу использовать переменные от w1 до w10 в качестве матрицы матрицы предиктора [N, W] весов; в моей модели Стэн. Я не уверен, как это сделать. фрейм данных (dat < - data ....
вопрос задан: 9 February 2019 11:01
1
ответ

Вычисление разницы, которая начинается заново, когда чередуется двухуровневый коэффициент

Я пытаюсь вычислить разницу, а затем, в конечном итоге, накопленную сумму разностей переменной. Расчеты основаны на факторе, который имеет два уровня и вычисления ...
вопрос задан: 23 January 2019 19:22
1
ответ

Как сохранить данные из pandastable?

Я создаю табличный интерфейс, в котором пользователь получит таблицу из pandastable и запишет некоторые данные. Затем мне нужно сохранить обновленный pandastable, чтобы сделать некоторые оценки. Как я мог это сделать? ...
вопрос задан: 21 January 2019 07:45
1
ответ

Как бороться с «Ошибка в data.frame (& hellip ;, check.names = FALSE)», когда я использую ggplot?

Я пытаюсь нарисовать графики плотности. Итак, я пошел посмотреть Введение в ggridges. Риджлайнс можно нарисовать в данный момент, но возникла проблема при рисовании графиков плотности. Но: ошибка ...
вопрос задан: 21 January 2019 00:27
1
ответ

Найти, где столбец соответствует более одного в другом столбце

Мне нужно, чтобы результаты имели кардинальность 1: 1, поэтому мне нужно проверить, существует ли значение в COL1 более одного раза в COL2 COL1 COL2 A 1 B 2 B 2 B 3 C 4 D 5 E 5 E 5 Использование Python (желательно .. ,
вопрос задан: 20 January 2019 12:10
1
ответ

Как мы можем сравнить два фрейма данных в spark scala, чтобы найти разницу между этими двумя файлами, какой столбец ?? а стоимость?

У меня есть два файла, и я создал два кадра данных prod1 и prod2 из него. Мне нужно найти записи с именами столбцов и значениями, которые не совпадают в обоих dfs. id_sk является первичным ключом. все ...
вопрос задан: 20 January 2019 12:09
1
ответ

Машинное обучение - со склеарном

Я пишу базовый фрагмент кода для прогнозирования акций, однако постоянно получаю следующую ошибку. AttributeError: у объекта 'function' нет атрибута 'train_test_split' Мой код, кроме всего этого ...
вопрос задан: 20 January 2019 10:15
1
ответ

Панды, нарезающие между датами, затем заменяют значения на ноль

У меня есть следующий DataFrame: канал столбец 1 столбец 2 столбец 3 дата 30.12.2008 638 4472 487 31.12.2008 868 6985 540 01.01.2009 755 ...
вопрос задан: 20 January 2019 07:19
1
ответ

Измените объекты типа d столбца (столбцов) в кадре данных pandas на логические значения [duplicate]

Что я делаю: Использование Pandas для анализа набора данных, взятых из опроса. У меня есть несколько столбцов с ответами Да или Нет. Что я хочу сделать и что я хочу спросить: Измените объект dtype на булево ...
вопрос задан: 19 January 2019 22:49
1
ответ

Как добавить имя в столбцы данных в пандах

Образец, подчеркнутый красным Это то, чего я пытаюсь достичь. Есть ли что-то похожее на добавление имени в индекс или это невозможно?
вопрос задан: 19 January 2019 22:06
1
ответ

как посчитать количество событий на одном data.frame на основе периода времени на другом data.frame

У меня есть два кадра данных, один с идентификатором, ДАТА и название препарата. Другой имеет идентификатор и дату события date.event. ожидаемый столбец prev_drug: как подсчитать количество разных лекарств до ...
вопрос задан: 19 January 2019 21:26
1
ответ

Панды GroupBy готовит каждую группу

У меня есть некоторые данные, из которых я хочу извлечь временной ряд доходов (сумма долларов в разные даты день в разных местах где) для разных продуктов (х и у). импортировать панд как pd # ...
вопрос задан: 19 January 2019 21:05
1
ответ

Нужно изменить мою структуру данных (много имен столбцов)

Я пытаюсь изменить форму данных в пандах. В настоящее время у меня есть одна переменная id, а остальные переменные имеют следующий формат: «variableyear», где год находится между 2000 и 2016. Я хочу ...
вопрос задан: 19 January 2019 20:49
1
ответ

Функция хеширования для нескольких категориальных функций (столбцы)

Я хотел бы добавить функцию «Жанр» в 6 столбцов и отдельно добавить «Издатель» в еще шесть столбцов. Я хочу что-то вроде ниже: Жанр Издатель 0 1 2 3 4 5 ...
вопрос задан: 19 January 2019 18:42
1
ответ

Как отфильтровать столбец даты в пандах?

Я хочу удалить дату в столбце ['ДАТА'] и использовать быстрый фильтр. Я делаю это: quickfilter = (df_dexu.DATE < 2018-12-1) df_dexu = df_dexu [quickfilter], но выдает сообщение об ошибке: ...
вопрос задан: 19 January 2019 17:58
1
ответ

Сохранение всех строк с верхними n элементами на основе количества значений в DataFrame

Я новичок в Python и Pandas и у меня есть некоторые проблемы в работе с DataFrames. У меня есть следующий набор данных в Pandas DataFrame. Счет-фактура StockCode Цена XXX ПродуктА ...
вопрос задан: 19 January 2019 17:49
1
ответ

Преобразование списка номеров деталей в двумерный массив ширины / длины для отображения в сетке

У меня есть список частей с каждой частью, состоящей из part_number, ширины и длины. Я хочу в конечном итоге отображать этот список в виде сетки, используя различные ширины в качестве меток столбцов и различные длины в качестве ...
вопрос задан: 19 January 2019 15:58
1
ответ

Панды: Найти исходный индекс значения с сгруппированным фреймом данных

У меня есть фрейм данных с RangeIndex, временными метками в первом столбце и несколькими тысячами часовых наблюдений за температурой во втором. Достаточно просто сгруппировать наблюдения по 24 и найти ...
вопрос задан: 19 January 2019 12:18
1
ответ

Пересчитать список, содержащий фреймы данных

У меня есть вложенные списки, которые я хотел бы редактировать. Чтобы сделать это удобным способом, я хотел использовать unlist и relist. Проблема заключается в том, что, по-видимому, проблема заключается не в уважении базовой структуры: # Некоторый списо
вопрос задан: 19 January 2019 12:14
1
ответ

Python - Создание фрейма данных, транспонирование и объединение его для получения таблицы

Я изучаю Python и у меня есть вопрос, связанный с созданием фрейма данных для каждых 5 строк, транспонированием и объединением фреймов данных. У меня есть файл .txt со следующим вводом. Это тысячи ...
вопрос задан: 19 January 2019 09:31
1
ответ

R Заменить имена в нескольких столбцах идентификаторами из другого объекта.

У меня есть набор данных о пациентах, если я пытаюсь идентифицировать их в структуре R. ...
вопрос задан: 19 January 2019 04:38
1
ответ

Как мне реорганизовать мой фрейм данных для запуска альфа Криппендорфа?

Мне нужно реорганизовать мой фрейм данных, чтобы я мог запустить альфа Криппендорфа. Какую функцию / элементарное решение я могу найти? Вот как выглядит мой фрейм данных: каждый участник имеет 7 строк (...
вопрос задан: 19 January 2019 01:30
1
ответ

Добавление столбца в фрейм данных PySpark включает стандартные отклонения столбца на основе группировки по двум другим столбцам

Предположим, что у нас есть CSV-файл, который был импортирован в виде фрейма данных в PysPark следующим образом из pyspark.sql import SparkSession spark = SparkSession.builder.getOrCreate () df = spark.read.csv ("file ...
вопрос задан: 19 January 2019 00:38
1
ответ

Сравнение последовательных строк данных на основе столбцов в Python

У меня есть датафрейм. Имеются данные о поставщиках. Если имя поставщика и группы совпадают, в идеале количество единиц должно быть одинаковым. Однако иногда это не так. Я пишу код ...
вопрос задан: 18 January 2019 23:58
1
ответ

Как я могу сравнить два кадра данных в пандах и обновить значения на основе ключей?

У меня есть два фрейма данных, и я хочу использовать синтаксис панд или методы для их сравнения и обновления значений из большего фрейма данных в меньший фрейм данных на основе похожих ключей. импорт импортный импорт ...
вопрос задан: 18 January 2019 23:56
1
ответ

Как перебрать столбцы датафрейма в R и вывести квантили () для каждого столбца как строку в новом фрейме данных

Я пытаюсь вычислить процентили каждого столбца данных, чтобы сохранить их в виде строк в новом. Затем я продолжу чертить этот новый df как линейный график, обернутый различными, основанными на ...
вопрос задан: 18 January 2019 23:07