0
ответов

For-Loop over (pd.read_pickle) DataFrame не работает

Я хочу хранить очень большой файл csv как pickle, так что мне не нужно читать файл csv каждый раз, когда я запускаю свой код. Вот как я это делаю: df_log = pd.read_csv ("Val_Nissan_Leaf / oneyearLeafLog.txt", ...
вопрос задан: 13 July 2018 15:12
0
ответов

Столбец данных данных Pandas, выбирающий значение из других столбцов

Множество подобных запросов уже здесь, но, похоже, не может найти того, что соответствует мне. У меня есть фрейм данных pandas, который содержит, главным образом, столбцы имен контрактов, а также значения с данными цены ...
вопрос задан: 13 July 2018 14:12
0
ответов

Ошибка оболочки Spark при создании DataFrame

Наличие данных CSV, как показано ниже (в разделе Sample data), пытается проанализировать данные с использованием искровой оболочки. Создал класс case: case class AadharDetails (Date: Int, Registrar: String, ...
вопрос задан: 13 July 2018 13:18
0
ответов

Анализ когорты Panda: от месяца к квартальной / семестровой / ежегодной когорте

Я новичок в Panda в Python, и теперь я застрял. Я работаю над Когортным анализом. Мне удалось печатать ежемесячное сохранение когорты, но я действительно не знаю, как считать активных пользователей кварталами. Я ...
вопрос задан: 13 July 2018 11:30
0
ответов

TypeError: неправильный тип операнда для унарного ~: 'NoneType'

У меня есть некоторые условия, написанные в правилах и вызывающие эти правила в python. Для некоторых условий код работает нормально, но ошибка возникает позже, когда я пытаюсь вызвать правило, исключая другие. Мой ...
вопрос задан: 13 July 2018 10:42
0
ответов

Транспонировать ежемесячные данные в строках, которые находятся в excel для столбцов (месяц мудрый) в фрейме данных python

дневные мудрые данные от июля до октября 2017 года. У меня есть дневные данные с июля по декабрь, которые находятся в rows.I хочу преобразовать эти строки в столбцы. Столбцы должны иметь заголовки как имя месяца, как показано ниже, которые я хочу ...
вопрос задан: 13 July 2018 05:33
0
ответов

Процентный символ в заголовке кадра данных

У меня есть символ% в моем заголовке. который является «95% процентиля» во втором столбце, я пытаюсь преодолеть пространство, сделав вместо этого «95% _percentile». Проблема в том, что ggplot не читал его, как я могу преодолеть ...
вопрос задан: 13 July 2018 04:48
0
ответов

Почему я получаю X. в именах столбцов при чтении фрейма данных?

Я задал вопрос об этом несколько месяцев назад, и я думал, что ответ решил мою проблему, но я снова столкнулся с проблемой, и решение не сработало для меня. Я импортирую CSV :заказов и...
вопрос задан: 26 June 2018 14:20
0
ответов

R - Объединить два фрейма данных?

Даны два фрейма данных a и b:> aabc 1 -0,2246894 -1,48167912 -1,65099363 2 0,5559320 -0,87898575 -0,15634590 3 1,8469466 -0,01487524 -0,53098215 4 -0,6875051 ...
вопрос задан: 17 June 2018 22:13
0
ответов

Сравнение двух столбцов во фрейме данных по множеству строк

У меня есть фрейм данных, с которым я работаю, в котором я хотел бы сравнить генотип точки данных с две ссылки S288C и SK1. Это сравнение будет выполнено по многим строкам (более 100) фрейма данных. ...
вопрос задан: 7 June 2018 14:38
0
ответов

Разделить столбец строки фрейма данных на несколько столбцов

Я хотел бы получить данные формы before = data.frame (attr = c (1,30,4, 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 ...
вопрос задан: 2 June 2018 21:37
0
ответов

Добавление столбца средних значений по группе к исходным данным [дубликат]

Я хочу добавить столбец средних значений на основе столбца факторов в R data.frame. Примерно так: df1 <- data.frame (X = rep (x = LETTERS [1: 2], each = 3), Y = 1: 6) df2 <- aggregate (data = df1, Y ~ X, FUN = mean) ...
вопрос задан: 2 June 2018 07:39
0
ответов

R - список к фрейму данных

У меня есть вложенный список данных. Его длина равна 132, а каждый элемент представляет собой список длиной 20. Существует ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных? Вот ...
вопрос задан: 31 May 2018 08:37
0
ответов

Pandas groupby.size vs series.value_counts vs collection.Counter с несколькими сериями

Есть много вопросов (1, 2, 3), касающихся подсчета значений в одной серии. Тем не менее, есть меньше вопросов о том, как лучше всего рассчитать комбинации из двух или более серий. Решения ...
вопрос задан: 17 May 2018 19:30
0
ответов

Самостоятельная ссылка

В R я часто делаю что-то вроде этого: adataframe [adataframe $ col == что-то] < -adataframe [adataframe $ col == что-то)] + 1 Этот способ довольно долгий и утомительный. Есть ли способ для ...
вопрос задан: 22 April 2018 21:19
0
ответов

Переименование нескольких столбцов фрейма данных, на которые ссылаются текущие имена

Я хочу переименовать некоторые случайные столбцы большого фрейма данных, и я хочу использовать имена текущих столбцов, а не индексы. Индексы столбцов могут измениться, если я добавлю или удалю столбцы из данных, поэтому я полагаю ...
вопрос задан: 20 April 2018 02:20
0
ответов

Как построить все столбцы фрейма данных в R

Фрейм данных имеет n столбцов, и я хотел бы получить n графиков, по одному графику для каждого столбца. Я новичок и плохо владею R, в любом случае нашел два решения. Первый работает, но не печатает ...
вопрос задан: 18 April 2018 12:26
0
ответов

Как распечатать (на бумаге) красиво отформатированный фрейм данных

Я хотел бы распечатать красиво отформатированные фреймы данных на бумаге, в идеале из скрипта. (Я пытаюсь собрать данные с помощью инструмента и автоматически обработать и распечатать их с помощью R-скрипта). ...
вопрос задан: 9 April 2018 15:43
0
ответов

Агрегирование/обобщение нескольких переменных в группе (например, сумма, среднее значение)

Существует ли простой способ агрегирования (сумма, среднее значение, максимальное значение и т. д.) нескольких переменных из фрейма данных одновременно? Ниже приведены некоторые примеры данных: библиотека (смазка) дней = 365*2 date = seq(as.Date("2000-0
вопрос задан: 8 April 2018 20:24
0
ответов

Определить типы данных столбцов фрейма данных

Я использую R и загрузил данные в фрейм данных, используя read.csv (). Как определить тип данных каждого столбца во фрейме данных?
вопрос задан: 5 April 2018 22:24
0
ответов

Отмена выбора столбец по имени

Есть ли способ выбрать все столбцы фрейма данных, кроме столбца с определенным именем. Это будет аналог df[, -1], за исключением использования имени столбца вместо индекса?
вопрос задан: 14 March 2018 07:29
0
ответов

Как работают панды Rolling объектов?

Редактировать: я сжал этот вопрос, учитывая, что он, вероятно, был слишком вовлечен для начала. Мясо вопроса выделено жирным шрифтом ниже. Я хотел бы узнать больше об объекте, который фактически создается, когда ...
вопрос задан: 4 March 2018 04:56
0
ответов

Использование grep для подмножества фрейма данных в R

У меня проблемы с подмножеством моих данных. Я хочу, чтобы данные были размещены в столбце x, где первые 3 символа начинаются с G45. Мой фрейм данных: x < - c ("G448", "G459", "G479", "G406") y < - c (1: 4) ...
вопрос задан: 19 February 2018 16:41
0
ответов

В чем разница между использованием loc и использованием только квадратных скобок для фильтрации столбцов в Pandas / Python?

Я заметил три метода выбора столбца в Pandas DataFrame: Первый метод выбора столбца с помощью loc: df_new = df.loc [:, 'col1'] Второй метод - кажется проще и быстрее: df_new = ...
вопрос задан: 23 January 2018 19:26
0
ответов

Объедините несколько кадров данных - Ошибка в match.names (clabs, имена (xi)): имена не соответствуют предыдущим именам

Я получаю некоторый действительно причудливый материал при попытке объединить несколько кадров данных.На помощь! Я должен объединить набор кадров данных столбцами 'RID' и 'VISCODE'. Вот пример того, что это смотрит...
вопрос задан: 23 January 2018 03:33
0
ответов

Как вставить кадр данных Pandas в уже существующую таблицу в базе данных?

Я использую sqlalchemy в pandas для запроса базы данных postgres, а затем вставляю результаты преобразования в другую таблицу в той же базе данных. Но когда я делаю df.to_sql ('db_table2', engine), я получаю это ...
вопрос задан: 22 January 2018 21:51
0
ответов

Фильтрация строк в наборе данных по столбцам

У меня есть следующая таблица: FN LN LN1 LN2 LN3 LN4 LN5 a b b x x x x a c b d e NA NA a d c a b x x a e b c d x e Я фильтрую записи, для которых LN ...
вопрос задан: 19 January 2018 21:50
0
ответов

Как добавить документацию в data.frame в R?

Я использовал R для некоторое время, и я понял, что было бы очень полезно, если бы вы могли прикрепить данные описания, содержащиеся в data.frame, потому что вы могли бы собрать всю полезную исследовательскую информацию в ....
вопрос задан: 19 January 2018 21:23
0
ответов

читать CSV в dataframe в Google Colab

Я пытаюсь прочитать CSV-файл, который я сохранил локально на моей машине. (Просто для дополнительной справки - это титанические данные из Kaggle, которые здесь.) Из этого вопроса и ответов я узнал, что вы можете ...
вопрос задан: 19 January 2018 11:43
0
ответов

Как вычесть предыдущую строку из текущей строки в фрейме данных pandas и применить ее к каждой строке; без использования цикла?

Я использую Python3.5, и я работаю с пандами. Я загрузил фондовые данные из Yahoo Finance и сохранил файлы в CSV. Мои DataFrames загружают эти данные из CSV. Это копия десяти ...
вопрос задан: 11 January 2018 08:57