Я перебираю файлы и применяю к ним преобразования. Эти преобразования сохраняются как массив 4x4 numpy. Он имеет следующую форму. [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, ...
Допустим, у меня есть ряд ценностей в пандах. Моя цель - оценить эмпирическую энтропию серии. Обычно я выполняю задачу в следующих двух шагах. а. вычислить ведро ...
Я хочу хранить очень большой файл csv как pickle, так что мне не нужно читать файл csv каждый раз, когда я запускаю свой код. Вот как я это делаю: df_log = pd.read_csv ("Val_Nissan_Leaf / oneyearLeafLog.txt", ...
Множество подобных запросов уже здесь, но, похоже, не может найти того, что соответствует мне. У меня есть фрейм данных pandas, который содержит, главным образом, столбцы имен контрактов, а также значения с данными цены ...
Новый отредактированный: Может кто-нибудь, пожалуйста, помогите мне с циклом for? Данные выглядят следующим образом: со следующим индексом и одним столбцом с df ['hold значение'] с некоторой строкой и некоторым значением NaN. Индекс(['...
Я загрузил базу данных Heart Bisease. Некоторые значения, такие как «restecg» и «cp», имеют более одного возможного значения. Я хотел бы выделить эти значения в свои собственные столбцы с помощью ...
Я новичок в Panda в Python, и теперь я застрял. Я работаю над Когортным анализом. Мне удалось печатать ежемесячное сохранение когорты, но я действительно не знаю, как считать активных пользователей кварталами. Я ...
Я использую случайный лес H2O для прогнозирования среди 70 целевых классов. Полученный H2OFrame из метода предсказания оценок имеет эти целевые классы как метки столбцов, и каждая строка содержит предсказанные ...
У меня есть dataframe «rep_data». Я хочу найти количество повторных вызовов для каждого User_uid. Логика повторных вызовов: - 1) Для тех же MSISDN и FEATURE_CODE, если есть другой (второй) CALL_LOG_CODE (...
Я пытаюсь прочитать большой CSV-файл (приблизительно 6 ГБ) в пандах и получаю следующую ошибку памяти: MemoryError Traceback (последний вызов был последним) < ipython-input -...
Я новичок в python и pandas. Я пытаюсь загрузить tsv-файл в pandas DataFrame. Вот что я пытаюсь сделать и получаю ошибку: >>> df1 = DataFrame(csv.reader(open('c:/~/...
У меня есть pandas.DataFrame df1, проиндексированный с помощью объекта pandas.DateRange. Если у меня есть d1 и d2 в качестве даты и времени, почему df[d1:d2] не работает и как я могу получить этот фрагмент?
Я борюсь с иерархическими индексами в пакете Python pandas. В частности, я не понимаю, как фильтровать и сравнивать данные в строках после их поворота. Вот пример таблицы...
Есть много вопросов (1, 2, 3), касающихся подсчета значений в одной серии. Тем не менее, есть меньше вопросов о том, как лучше всего рассчитать комбинации из двух или более серий. Решения ...
Я пытаюсь реализовать LSTM с Keras. Я знаю, что для LSTM в Керасе требуется трехмерный тензор с формой (nb_samples, timesteps, input_dim) в качестве входных данных. Тем не менее, я не совсем уверен, как вход ...
Я пытаюсь построить некоторые данные с помощью pandas в блокноте Ipython, и хотя он дает мне объект, на самом деле он не строит сам график. Итак, это выглядит так: В [7]: залог.Amount.plot() Out[...
Я застрял на чем-то, что кажется, должно быть относительно легко. Код, который я привожу ниже, является примером, основанным на более крупном проекте, над которым я работаю. Я не видел причин размещать все детали, поэтому, пожалуйста ...
Редактировать: я сжал этот вопрос, учитывая, что он, вероятно, был слишком вовлечен для начала. Мясо вопроса выделено жирным шрифтом ниже. Я хотел бы узнать больше об объекте, который фактически создается, когда ...
Я заметил три метода выбора столбца в Pandas DataFrame: Первый метод выбора столбца с помощью loc: df_new = df.loc [:, 'col1'] Второй метод - кажется проще и быстрее: df_new = ...
Я использую sqlalchemy в pandas для запроса базы данных postgres, а затем вставляю результаты преобразования в другую таблицу в той же базе данных. Но когда я делаю df.to_sql ('db_table2', engine), я получаю это ...
Я использую Python3.5, и я работаю с пандами. Я загрузил фондовые данные из Yahoo Finance и сохранил файлы в CSV. Мои DataFrames загружают эти данные из CSV. Это копия десяти ...
Я наткнулся на pandas, и это выглядит идеально для простых вычислений, которые я хотел бы сделать. У меня есть опыт работы с SAS, и я думал, что он заменит proc freq — похоже, он масштабируется до того, что я могу захотеть…
Имеет ли pandas (или другой модуль) какие-либо функции для поддержки объединения (или объединения) двух таблиц на основе нескольких ключей? Например, у меня есть две таблицы (DataFrames) a и b: > > > a A B значение1 1 1 ...
Я только начинаю работать с Pandas и читаю CSV-файл, используя метод read_csv(). Трудность, с которой я сталкиваюсь, заключается в том, что панды не могут преобразовать мои телефонные номера в большие числа, ...
Для сюжета sns.countplot (x = "HostRamSize", data = df) я получил следующий график со смешиванием меток оси x, как мне избежать этого? Должен ли я изменить размер графика, чтобы решить эту проблему?
Существует ли простой способ проверить, являются ли два фрейма данных разными копиями или представлениями одних и тех же базовых данных, которые не связаны с манипуляциями? Я пытаюсь получить контроль, когда каждый генерируется, ...