0
ответов

AttributeError: у объекта 'Series' нет атрибута 'reshape'

Я использую Sci-Kit Learn алгоритм линейной регрессии. При масштабировании целевой функции Y с помощью: Ys = scaler.fit_transform (Y) я получил ValueError: Ожидаемый 2D-массив, вместо этого получил 1D-массив: После этого я ...
вопрос задан: 11 December 2018 13:18
0
ответов

Pandas dataframe: удалить вторичное предстоящее то же значение

У меня есть фрейм данных: col1 col2 a 0 b 1 c 1 d 0 c 1 d 0 В 'col2' я хочу оставить только первую 1 сверху и заменить каждую 1 ниже первой на 0, например ...
вопрос задан: 6 December 2018 15:46
0
ответов

Экспорт данных Pandas в виде изображения таблицы

Можно ли экспортировать кадр данных Pandas в виде файла изображения? Что-то вроде df.to_png () или df.to_table (). Savefig ('table.png'). На данный момент я экспортирую фрейм данных, используя df.to_csv (). Я тогда открою это ...
вопрос задан: 3 December 2018 16:17
0
ответов

Выбор нескольких столбцов в кадре данных pandas

У меня есть данные в разных столбцах, но я не знаю, как извлечь их, чтобы сохранить в другой переменной. index a b c 1 2 3 4 2 3 4 5 Как выбрать «a», «b» и сохранить их в df1? ...
вопрос задан: 2 December 2018 06:06
0
ответов

Преобразование серии списков панд в датафрейм

У меня есть серия из списков импорта панд как pd s = pd.Series ([[1, 2, 3], [4, 5, 6]]), и я хочу DataFrame с каждым столбцом списка. Ни один из from_items, from_records, DataFrame Series.to_frame ...
вопрос задан: 27 November 2018 22:09
0
ответов

Добавьте метки x и y к графику панд

Предположим, у меня есть следующий код, который строит что-то очень простое с использованием панд: импортировать панд как значения pd = [[1, 2], [2, 5]] df2 = pd.DataFrame (values, columns = ['Type A', ' Тип B '], ...
вопрос задан: 20 October 2018 23:05
0
ответов

Панды Заменить NaN пустой / пустой строкой

У меня есть Pandas Dataframe, как показано ниже: 1 2 3 0 a чтение NaN 1 b l непрочитанное чтение 2 c чтение NaN Я хочу удалить значения NaN пустой строкой, чтобы она выглядела так: ...
вопрос задан: 20 October 2018 20:38
0
ответов

Как установить dtypes по столбцам в пандах DataFrame

Я хочу перенести некоторые данные в панду DataFrame и назначить dtypes для каждого столбца при импорте. Я хочу быть в состоянии сделать это для больших наборов данных со многими различными столбцами, но, как ...
вопрос задан: 19 October 2018 13:06
0
ответов

Извлечь int из строки в Пандах

Допустим, у меня есть фрейм данных df как AB 1 V2 3 W42 1 S03 2 T02 3 U71 Я хочу иметь новый столбец (либо в конце df, либо заменить столбец B на него, как это не имеет значения), который только извлекает ...
вопрос задан: 3 October 2018 00:11
0
ответов

Эквивалент макросов Stata в Python

Я пытаюсь использовать Python для статистического анализа. В Stata я могу определять локальные макросы и расширять их по мере необходимости: программа определяет синтаксис reg2 varlist (min = 1 max = 1), indepvars (string) results (...
вопрос задан: 26 September 2018 19:45
0
ответов

Блокнот Jupyter python3 не может распознавать панд

Я использую ноутбук Jupyter с выбранным Python 3. В первой строке ячейки я ввожу: import pandas as pd. Ошибка, которую я получаю из записной книжки, - ImportError: Нет модуля с именем 'pandas'. ...
вопрос задан: 26 September 2018 19:08
0
ответов

Python: панды объединяют несколько фреймов данных

У меня есть разные фреймы данных, и мне нужно объединить их на основе столбца даты. Если бы у меня было только два кадра данных, я мог бы использовать df1.merge (df2, on = 'date'), чтобы сделать это с тремя кадрами данных, я бы использовал df1 ....
вопрос задан: 24 September 2018 14:50
0
ответов

Как изменить тип dtype определенных столбцов переназначения numpy?

Предположим, у меня есть переназначение, подобное следующему: import numpy as np # пример данных из ответа @unutbu recs = [('Билл', '31', 260.0), ('Фред', 15, '145.0')] r = np.rec.fromrecords(recs, formats = '...
вопрос задан: 20 September 2018 12:32
0
ответов

панда трехстороннее объединение нескольких фреймов данных на столбцах

У меня есть 3 файла CSV. Каждый из них имеет первый столбец в виде (строковых) имен людей, тогда как все остальные столбцы в каждом фрейме данных являются атрибутами этого человека. Как я могу "объединить" все три CSV ...
вопрос задан: 10 September 2018 21:08
0
ответов

Pandas dataframe условное среднее на основе имен столбцов

Это будет проще всего объяснить, начиная с выборки данных: TimeStamp 382.098 382.461 383.185 383.548 10:28:00 0.012448 0.012362 0.0124485 0.012362 ...
вопрос задан: 6 September 2018 01:43
0
ответов

построение сложенных гистограмм на фрейме данных pandas

Это моя первая попытка поиграть с библиотекой Pandas после посещения учебника Уэсли в pycon, Немного поковырявшись с фреймом данных, я рад Я смог массировать данные так, как я…
вопрос задан: 3 September 2018 16:10
0
ответов

Разделить DataFrame на первую строку

Я проверил документацию. Я не понимаю, как индексировать Pandas DataFrame. Я хотел бы разделить DataFrame цен на акции на их соответствующие начальные значения, чтобы проиндексировать различные...
вопрос задан: 29 August 2018 05:51
0
ответов

подклассы объекта pandas работают иначе, чем подклассы другого объекта?

Я пытаюсь создать подкласс структуры данных Pandas, чтобы заменить в своем коде подкласс dict подклассом Series, я не понимаю, почему этот пример кода не работает из...
вопрос задан: 28 August 2018 21:52
0
ответов

панды лок против илок против икс против у против иат?

Недавно начал переходить из моего безопасного места (R) в Python, и меня немного смущает локализация / выборка ячеек в Pandas. Я прочитал документацию, но я пытаюсь понять ...
вопрос задан: 23 August 2018 22:06
0
ответов

python-pandas и базы данных типа mysql

Документация для Pandas содержит множество примеров лучших практик для работы с данными, хранящимися в различных форматах, однако я не могу найти хороших примеров для работы с базами данных, таких как ...
вопрос задан: 23 August 2018 14:10
0
ответов

Выберите строки DataFrame между двумя датами

Я создаю DataFrame из CSV следующим образом: stock = pd.read_csv ('data_in /' + filename + '.csv', skipinitialspace = True) DataFrame имеет столбец даты. Есть ли способ создать новый DataFrame (...
вопрос задан: 17 August 2018 04:25
0
ответов

Среднее по строке для подмножества столбцов с пропущенными значениями

У меня есть DataFrame, который иногда пропускает значения и выглядит примерно так: понедельник, вторник, среда ========================== ===================== ...
вопрос задан: 27 July 2018 13:29
0
ответов

Организация мультииндекса по правильному дню

Предположим, у меня есть электронная коммерция, и я хотел бы ежемесячно анализировать общие заказы в определенный день. Я хочу создать календарь, подобный кадру данных за месяц. Я попытался создать точку опоры ...
вопрос задан: 13 July 2018 22:39
0
ответов

ОШИБКА в объекте типа PYTHON «Лист» не имеет атрибута «добавить»

У меня ошибка в коде python. Я пытаюсь разделить книгу на разные листы на основе значения столбца, ниже приведен код. import pandas as pd import os from xlwings import Book, Range, Sheet path = ('C: \ ...
вопрос задан: 13 July 2018 22:24
0
ответов

Использование continue в try / except statement

Я работаю с рамкой данных Pandas и итерируя по строкам, чтобы найти соответствующие данные, в данном случае, цвета. По большей части, ячейка столбца «Цвет» будет заполнена, и в этом случае я не ...
вопрос задан: 13 July 2018 21:13
0
ответов

Входные данные последовательности в TensorFlow

Я смущен относительно размера партии и временных шагов в тензорном потоке. Как я могу подать рекуррентную нейронную сеть, если, скажем, у меня есть 3 функции и 3 временных шага для каждого пациента (id)? Взгляни ...
вопрос задан: 13 July 2018 19:39
0
ответов

'& gt; =' не поддерживается между экземплярами 'tuple' и 'datetime.datetime'

Я использую Python3 и имею следующий код (частичный код). tsret = pd.DataFrame (index = tslag.index) start_date = datetime.datetime (2011,1,10) tsret = tsret [tsret.index & gt; = start_date] tslag in ...
вопрос задан: 13 July 2018 19:36
0
ответов

Как читать, изменять и сохранять файл GeoJson от Pandas

У меня есть dataframe из файла geojson. После внесения некоторых изменений в кадр данных, как я могу сохранить DataFrame обратно в файл geojson? импортировать pandas из pandas.io.json import json_normalize data = pandas ....
вопрос задан: 13 July 2018 18:01
0
ответов

Как я могу загрузить файл excel, который находится на hdfs в панду или искровой стол?

У меня есть набор данных excel, который загружается в hdfs, используя представления Ambari. Я мог бы найти путь к чему-то вроде: '/org/dir1/dir2/DATA/LKUP_AAL_PeakOut_By_Zip_WS.xlsx' Я работаю над ...
вопрос задан: 13 July 2018 17:37
0
ответов

Проблемы с производительностью кода при масштабировании

Ниже приведен код: clus = 0 для ix, sd в tqdm (перечисление (cs_df)): try: idxs = cs_df [ix] [cs_df [ix] & gt; порог]. index.values ​​distclust.loc [idxs, "simvals"] = cs_df [ix] [...
вопрос задан: 13 July 2018 16:25