0
ответов

Python to file - лучший способ хранения строк с 2D-массивом

Я перебираю файлы и применяю к ним преобразования. Эти преобразования сохраняются как массив 4x4 numpy. Он имеет следующую форму. [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, ...
вопрос задан: 13 July 2018 16:05
0
ответов

Каков быстрый способ вычисления эмпирической энтропии для ряда значений в пандах?

Допустим, у меня есть ряд ценностей в пандах. Моя цель - оценить эмпирическую энтропию серии. Обычно я выполняю задачу в следующих двух шагах. а. вычислить ведро ...
вопрос задан: 13 July 2018 15:56
0
ответов

For-Loop over (pd.read_pickle) DataFrame не работает

Я хочу хранить очень большой файл csv как pickle, так что мне не нужно читать файл csv каждый раз, когда я запускаю свой код. Вот как я это делаю: df_log = pd.read_csv ("Val_Nissan_Leaf / oneyearLeafLog.txt", ...
вопрос задан: 13 July 2018 15:12
0
ответов

Столбец данных данных Pandas, выбирающий значение из других столбцов

Множество подобных запросов уже здесь, но, похоже, не может найти того, что соответствует мне. У меня есть фрейм данных pandas, который содержит, главным образом, столбцы имен контрактов, а также значения с данными цены ...
вопрос задан: 13 July 2018 14:12
0
ответов

создать новый столбец на основе другого столбца

Новый отредактированный: Может кто-нибудь, пожалуйста, помогите мне с циклом for? Данные выглядят следующим образом: со следующим индексом и одним столбцом с df ['hold значение'] с некоторой строкой и некоторым значением NaN. Индекс(['...
вопрос задан: 13 July 2018 13:35
0
ответов

Преобразование номеров экспоненциальной нотации в строки - объяснение

У меня есть DataFrame из этого вопроса: temp = u "" "Total, Price, test_num 0,71.7,2.04256e + 14 1,39.5,2.04254e + 14 2,82.2,2.04188e + 14 3,42.9,2.04171e + 14 "" "df = pd.read_csv (pd.compat.StringIO (temp)) print (df) ...
вопрос задан: 13 July 2018 12:24
0
ответов

Получение «чайников» из набора данных с использованием javascript

Я загрузил базу данных Heart Bisease. Некоторые значения, такие как «restecg» и «cp», имеют более одного возможного значения. Я хотел бы выделить эти значения в свои собственные столбцы с помощью ...
вопрос задан: 13 July 2018 11:56
0
ответов

Анализ когорты Panda: от месяца к квартальной / семестровой / ежегодной когорте

Я новичок в Panda в Python, и теперь я застрял. Я работаю над Когортным анализом. Мне удалось печатать ежемесячное сохранение когорты, но я действительно не знаю, как считать активных пользователей кварталами. Я ...
вопрос задан: 13 July 2018 11:30
0
ответов

Сортировка таблицы прогнозов для нескольких классов Pandas по каждой строке по вероятности

Я использую случайный лес H2O для прогнозирования среди 70 целевых классов. Полученный H2OFrame из метода предсказания оценок имеет эти целевые классы как метки столбцов, и каждая строка содержит предсказанные ...
вопрос задан: 13 July 2018 08:52
0
ответов

условное деление в python pandas на несколько столбцов

можно получить выход, как показано ниже. Я хочу получить выход с данного входа. Входной атрибут Страна Месяц Год значение A AUS 5/1/2018 ...
вопрос задан: 13 July 2018 06:09
0
ответов

Повторить логику вызовов с помощью Pandas

У меня есть dataframe «rep_data». Я хочу найти количество повторных вызовов для каждого User_uid. Логика повторных вызовов: - 1) Для тех же MSISDN и FEATURE_CODE, если есть другой (второй) CALL_LOG_CODE (...
вопрос задан: 13 July 2018 06:08
0
ответов

Как прочитать CSV-файл объемом 6 ГБ с пандами

Я пытаюсь прочитать большой CSV-файл (приблизительно 6 ГБ) в пандах и получаю следующую ошибку памяти: MemoryError Traceback (последний вызов был последним) < ipython-input -...
вопрос задан: 21 June 2018 22:47
0
ответов

Как загрузить tsv-файл в Pandas DataFrame?

Я новичок в python и pandas. Я пытаюсь загрузить tsv-файл в pandas DataFrame. Вот что я пытаюсь сделать и получаю ошибку: >>> df1 = DataFrame(csv.reader(open('c:/~/...
вопрос задан: 21 June 2018 10:39
0
ответов

Как выполнить нарезку фрейма данных с помощью дат и времени?

У меня есть pandas.DataFrame df1, проиндексированный с помощью объекта pandas.DateRange. Если у меня есть d1 и d2 в качестве даты и времени, почему df[d1:d2] не работает и как я могу получить этот фрагмент?
вопрос задан: 2 June 2018 22:11
0
ответов

Фильтрация и выбор из сводных таблиц, созданных с помощью python pandas

Я борюсь с иерархическими индексами в пакете Python pandas. В частности, я не понимаю, как фильтровать и сравнивать данные в строках после их поворота. Вот пример таблицы...
вопрос задан: 1 June 2018 09:03
0
ответов

Pandas groupby.size vs series.value_counts vs collection.Counter с несколькими сериями

Есть много вопросов (1, 2, 3), касающихся подсчета значений в одной серии. Тем не менее, есть меньше вопросов о том, как лучше всего рассчитать комбинации из двух или более серий. Решения ...
вопрос задан: 17 May 2018 19:30
0
ответов

Нейронная сеть LSTM входной формы из кадра данных

Я пытаюсь реализовать LSTM с Keras. Я знаю, что для LSTM в Керасе требуется трехмерный тензор с формой (nb_samples, timesteps, input_dim) в качестве входных данных. Тем не менее, я не совсем уверен, как вход ...
вопрос задан: 2 May 2018 09:48
0
ответов

Площадь каждого элемента колонны в пандах

Как можно выровнять каждый элемент столбца / серии DataFrame в пандах (и создать еще один столбец для хранения результата)?
вопрос задан: 19 April 2018 18:33
0
ответов

в блокноте Ipython / Jupyter, Pandas не отображает график, который я пытаюсь построить

Я пытаюсь построить некоторые данные с помощью pandas в блокноте Ipython, и хотя он дает мне объект, на самом деле он не строит сам график. Итак, это выглядит так: В [7]: залог.Amount.plot() Out[...
вопрос задан: 26 March 2018 20:20
0
ответов

Добавление меток значений на гистограмму matplotlib

Я застрял на чем-то, что кажется, должно быть относительно легко. Код, который я привожу ниже, является примером, основанным на более крупном проекте, над которым я работаю. Я не видел причин размещать все детали, поэтому, пожалуйста ...
вопрос задан: 18 March 2018 16:09
0
ответов

Как работают панды Rolling объектов?

Редактировать: я сжал этот вопрос, учитывая, что он, вероятно, был слишком вовлечен для начала. Мясо вопроса выделено жирным шрифтом ниже. Я хотел бы узнать больше об объекте, который фактически создается, когда ...
вопрос задан: 4 March 2018 04:56
0
ответов

Панды groupby (), agg () - как вернуть результаты без мультииндекса?

У меня есть фрейм данных: pe_odds [['EVENT_ID', 'SELECTION_ID', 'ODDS']] Out [67]: EVENT_ID SELECTION_ID ODDS 0 100429300 5297529 18.00 1 100429300 5297529 20.00 2 100429300 ...
вопрос задан: 16 February 2018 05:23
0
ответов

В чем разница между использованием loc и использованием только квадратных скобок для фильтрации столбцов в Pandas / Python?

Я заметил три метода выбора столбца в Pandas DataFrame: Первый метод выбора столбца с помощью loc: df_new = df.loc [:, 'col1'] Второй метод - кажется проще и быстрее: df_new = ...
вопрос задан: 23 January 2018 19:26
0
ответов

Как вставить кадр данных Pandas в уже существующую таблицу в базе данных?

Я использую sqlalchemy в pandas для запроса базы данных postgres, а затем вставляю результаты преобразования в другую таблицу в той же базе данных. Но когда я делаю df.to_sql ('db_table2', engine), я получаю это ...
вопрос задан: 22 January 2018 21:51
0
ответов

Как вычесть предыдущую строку из текущей строки в фрейме данных pandas и применить ее к каждой строке; без использования цикла?

Я использую Python3.5, и я работаю с пандами. Я загрузил фондовые данные из Yahoo Finance и сохранил файлы в CSV. Мои DataFrames загружают эти данные из CSV. Это копия десяти ...
вопрос задан: 11 January 2018 08:57
0
ответов

Простая кросс-табуляция в pandas

Я наткнулся на pandas, и это выглядит идеально для простых вычислений, которые я хотел бы сделать. У меня есть опыт работы с SAS, и я думал, что он заменит proc freq — похоже, он масштабируется до того, что я могу захотеть…
вопрос задан: 30 December 2017 10:17
0
ответов

Слияние двух DataFrames на основе нескольких ключей в пандах

Имеет ли pandas (или другой модуль) какие-либо функции для поддержки объединения (или объединения) двух таблиц на основе нескольких ключей? Например, у меня есть две таблицы (DataFrames) a и b: > > > a A B значение1 1 1 ...
вопрос задан: 26 December 2017 17:08
0
ответов

Указание типа данных в Pandas csv reader

Я только начинаю работать с Pandas и читаю CSV-файл, используя метод read_csv(). Трудность, с которой я сталкиваюсь, заключается в том, что панды не могут преобразовать мои телефонные номера в большие числа, ...
вопрос задан: 12 December 2017 01:30
0
ответов

Как предотвратить наложение меток оси X в sns.countplot

Для сюжета sns.countplot (x = "HostRamSize", data = df) я получил следующий график со смешиванием меток оси x, как мне избежать этого? Должен ли я изменить размер графика, чтобы решить эту проблему?
вопрос задан: 9 December 2017 13:10
0
ответов

Проверка, является ли фрейм данных копированием или просмотром в Pandas

Существует ли простой способ проверить, являются ли два фрейма данных разными копиями или представлениями одних и тех же базовых данных, которые не связаны с манипуляциями? Я пытаюсь получить контроль, когда каждый генерируется, ...
вопрос задан: 1 December 2017 17:17