Я хочу хранить очень большой файл csv как pickle, так что мне не нужно читать файл csv каждый раз, когда я запускаю свой код. Вот как я это делаю: df_log = pd.read_csv ("Val_Nissan_Leaf / oneyearLeafLog.txt", ...
Множество подобных запросов уже здесь, но, похоже, не может найти того, что соответствует мне. У меня есть фрейм данных pandas, который содержит, главным образом, столбцы имен контрактов, а также значения с данными цены ...
Наличие данных CSV, как показано ниже (в разделе Sample data), пытается проанализировать данные с использованием искровой оболочки. Создал класс case: case class AadharDetails (Date: Int, Registrar: String, ...
Я новичок в Panda в Python, и теперь я застрял. Я работаю над Когортным анализом. Мне удалось печатать ежемесячное сохранение когорты, но я действительно не знаю, как считать активных пользователей кварталами. Я ...
У меня есть некоторые условия, написанные в правилах и вызывающие эти правила в python. Для некоторых условий код работает нормально, но ошибка возникает позже, когда я пытаюсь вызвать правило, исключая другие. Мой ...
дневные мудрые данные от июля до октября 2017 года. У меня есть дневные данные с июля по декабрь, которые находятся в rows.I хочу преобразовать эти строки в столбцы. Столбцы должны иметь заголовки как имя месяца, как показано ниже, которые я хочу ...
У меня есть символ% в моем заголовке. который является «95% процентиля» во втором столбце, я пытаюсь преодолеть пространство, сделав вместо этого «95% _percentile». Проблема в том, что ggplot не читал его, как я могу преодолеть ...
Я задал вопрос об этом несколько месяцев назад, и я думал, что ответ решил мою проблему, но я снова столкнулся с проблемой, и решение не сработало для меня. Я импортирую CSV :заказов и...
У меня есть фрейм данных, с которым я работаю, в котором я хотел бы сравнить генотип точки данных с две ссылки S288C и SK1. Это сравнение будет выполнено по многим строкам (более 100) фрейма данных. ...
Я хочу добавить столбец средних значений на основе столбца факторов в R data.frame. Примерно так: df1 <- data.frame (X = rep (x = LETTERS [1: 2], each = 3), Y = 1: 6)
df2 <- aggregate (data = df1, Y ~ X, FUN = mean) ...
У меня есть вложенный список данных. Его длина равна 132, а каждый элемент представляет собой список длиной 20. Существует ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных? Вот ...
Есть много вопросов (1, 2, 3), касающихся подсчета значений в одной серии. Тем не менее, есть меньше вопросов о том, как лучше всего рассчитать комбинации из двух или более серий. Решения ...
В R я часто делаю что-то вроде этого: adataframe [adataframe $ col == что-то] < -adataframe [adataframe $ col == что-то)] + 1 Этот способ довольно долгий и утомительный. Есть ли способ для ...
Я хочу переименовать некоторые случайные столбцы большого фрейма данных, и я хочу использовать имена текущих столбцов, а не индексы. Индексы столбцов могут измениться, если я добавлю или удалю столбцы из данных, поэтому я полагаю ...
Фрейм данных имеет n столбцов, и я хотел бы получить n графиков, по одному графику для каждого столбца. Я новичок и плохо владею R, в любом случае нашел два решения. Первый работает, но не печатает ...
Я хотел бы распечатать красиво отформатированные фреймы данных на бумаге, в идеале из скрипта. (Я пытаюсь собрать данные с помощью инструмента и автоматически обработать и распечатать их с помощью R-скрипта). ...
Существует ли простой способ агрегирования (сумма, среднее значение, максимальное значение и т. д.) нескольких переменных из фрейма данных одновременно? Ниже приведены некоторые примеры данных: библиотека (смазка)
дней = 365*2
date = seq(as.Date("2000-0
Есть ли способ выбрать все столбцы фрейма данных, кроме столбца с определенным именем. Это будет аналог df[, -1], за исключением использования имени столбца вместо индекса?
Редактировать: я сжал этот вопрос, учитывая, что он, вероятно, был слишком вовлечен для начала. Мясо вопроса выделено жирным шрифтом ниже. Я хотел бы узнать больше об объекте, который фактически создается, когда ...
У меня проблемы с подмножеством моих данных. Я хочу, чтобы данные были размещены в столбце x, где первые 3 символа начинаются с G45. Мой фрейм данных: x < - c ("G448", "G459", "G479", "G406") y < - c (1: 4) ...
Я заметил три метода выбора столбца в Pandas DataFrame: Первый метод выбора столбца с помощью loc: df_new = df.loc [:, 'col1'] Второй метод - кажется проще и быстрее: df_new = ...
Я получаю некоторый действительно причудливый материал при попытке объединить несколько кадров данных.На помощь! Я должен объединить набор кадров данных столбцами 'RID' и 'VISCODE'. Вот пример того, что это смотрит...
Я использую sqlalchemy в pandas для запроса базы данных postgres, а затем вставляю результаты преобразования в другую таблицу в той же базе данных. Но когда я делаю df.to_sql ('db_table2', engine), я получаю это ...
У меня есть следующая таблица: FN LN LN1 LN2 LN3 LN4 LN5 a b b x x x x a c b d e NA NA a d c a b x x a e b c d x e Я фильтрую записи, для которых LN ...
Я использовал R для некоторое время, и я понял, что было бы очень полезно, если бы вы могли прикрепить данные описания, содержащиеся в data.frame, потому что вы могли бы собрать всю полезную исследовательскую информацию в ....
Я пытаюсь прочитать CSV-файл, который я сохранил локально на моей машине. (Просто для дополнительной справки - это титанические данные из Kaggle, которые здесь.) Из этого вопроса и ответов я узнал, что вы можете ...
Я использую Python3.5, и я работаю с пандами. Я загрузил фондовые данные из Yahoo Finance и сохранил файлы в CSV. Мои DataFrames загружают эти данные из CSV. Это копия десяти ...