0
ответов

Можно ли отсортировать фрейм данных на основе текста в столбце, который на самом деле является массивом слов?

Столбец в наборе данных о товаре содержит описание категории товара, где пол упоминается как Девочка / Мальчик / Мужчины / Женщины. Можно ли прочитать этот текст и отсортировать фрейм данных на основе ...
вопрос задан: 5 March 2019 06:47
0
ответов

согласовать строки одного столбца в зависимости от условия другого столбца

У меня есть фрейм данных, который я хочу удалить дубликаты в столбце с именем «sample» и добавить информацию о строках в столбцах gene и status в новый столбец, как показано на прилагаемых фотографиях. Спасибо тебе ...
вопрос задан: 5 March 2019 04:12
0
ответов

DataConversionWarning on sklearn Логистическая регрессия

Я пытаюсь выполнить логистическую регрессию в sklearn ниже: из sklearn.linear_model import Классификатор LogisticRegression = LogisticRegression (random_state = 0) mod_data2 = mod_data.copy () ...
вопрос задан: 5 March 2019 03:23
0
ответов

Обновление Pandas Dataframe на основе сопоставления значений для электронной почты, но с заменой идентификатора пользователя

Я пытаюсь выяснить, как обновить значение столбца, строки на основе соответствия столбца и строки в другом Df. Например: api_df: адрес электронной почты UUID abc@abc.com 1234 bdc @ ...
вопрос задан: 5 March 2019 02:10
0
ответов

Циклы Добавление значения исправления в Dataframe (накапливается в будущих)

Я пытаюсь смоделировать уровень запасов в течение следующих 6 месяцев: 1- У меня есть ожидаемый накопленный спрос на каждый день следующих 6 месяцев. Таким образом, без повторного заказа, мой баланс будет более отрицательным ...
вопрос задан: 5 March 2019 01:39
0
ответов

разобрать файл json из VoTT

Я хотел бы проанализировать JSON, сгенерированный Vott от Microsoft. Цель состоит в том, чтобы использовать эти данные с labelimg, который более прост в использовании (его XML-файл генерировать легче, чем json из vott) ....
вопрос задан: 4 March 2019 15:53
0
ответов

Добавление новых записей на основе даты и времени

У меня есть панда датафрейм, в котором он содержит два столбца sdate и date. Если дата и дата не совпадают, следует добавить новые строки. Например, если дата 17 января 2019: 23: 56: 24 и редактирование ...
вопрос задан: 4 March 2019 14:20
0
ответов

Ускорение операций с кодом Python над файлами CSV

Описание проблемы: у меня есть модуль, который читает файл .csv и суммирует значение столбца, используя numpy.sum (axis = 0). Этот модуль вызывается для каждого n .csv файлов. Сейчас я выполняю это ...
вопрос задан: 3 March 2019 19:04
0
ответов

Обработка данных внутри панелей данных

У меня есть одна проблема с одним из моих проектов в школе. Я пытаюсь изменить порядок своих данных. Вы можете оценить, как данные расположены, эта картинка содержит образец данных, которые я ...
вопрос задан: 3 March 2019 18:27
0
ответов

Разделить на контейнеры, используя уникальные значения переменных в пандах DataFrame

нужна помощь в разделении фрейма данных на x бинов, используя только уникальные значения в переменной. binsize = 3 df ['col1'] = [1,5,10,15,20,50,100,80] df ['val'] = [1,0,0,0,1,1,1,1] Right сейчас самое ...
вопрос задан: 3 March 2019 10:29
0
ответов

SVR предсказывает одинаковое значение для всех функций

Я создаю базовое приложение для прогнозирования «цены закрытия» акции на день n + 1, учитывая особенности акции n с использованием Python и Scikit-learn. Пример строки в моем фрейме данных выглядит следующим образом (2000 строк) ...
вопрос задан: 3 March 2019 10:02
0
ответов

DataFrame комплексный словарь JSON

Мой json форматируется следующим образом: образец json (только один ответ): [{"FaceDetails": [{"BoundingBox": {"Width": 0.20645833015441895, "Height": 0.34566667675971985, "Left": 0.1320784091949463, "Top" : 0 ....
вопрос задан: 2 March 2019 20:26
0
ответов

Как можно написать агрегат по столбцу с groupby по другим столбцам и условия по столбцу времени?

Можно ли записать агрегат по столбцу с групповым по другим столбцам и условия по столбцу времени? Вопрос заключается в следующем: по группам на DATE, FROM и TO рассчитать количество пассажиров в период -...
вопрос задан: 2 March 2019 12:51
0
ответов

Преобразовать в категориальные данные в пандах

Я пытаюсь получить меньший и более быстрый фрейм данных. Ранее у меня были некоторые категориальные столбцы, которые содержат только целые числа, и я подумал, что преобразование их в int может сэкономить мне память, но ...
вопрос задан: 2 March 2019 10:18
0
ответов

Не может формировать данные в Pandas

У меня есть эта строка кода, которая читает файл панд. Затем я хочу определить имена столбцов в той же строке кода, но это дает мне ошибку. Я не уверен, как решить ... может быть, синтаксис? Пожалуйста ...
вопрос задан: 2 March 2019 02:51
0
ответов

Как подготовить & ldquo; Fuzzy C Means & rdquo; кластеры в питоне?

Я новичок в программировании на Python. У меня есть набор данных, содержащий одномерные данные; то есть он содержит значения температуры ИК-изображения и имеет в общей сложности 306560 значений. Я успешно сделал Fuzzy C Средства ...
вопрос задан: 1 March 2019 01:06
0
ответов

Маскировка Hex / Binary & amp; Подсчет 1-го кадра панд

Итак, у меня есть этот фрейм данных, и один из столбцов содержит шестнадцатеричные значения. И тогда у меня есть эта маска: mask = 0b 0000 0100 0010 0001 Я хочу иметь возможность маскировать шестнадцатеричные значения с помощью приведенного выше ...
вопрос задан: 28 February 2019 22:36
0
ответов

Панды: как применить ряд функций к нескольким парам столбцов

Я использую старые данные прогноза численности населения, чтобы установить пропорцию роста в разных городах, а затем умножить ее на недавно обновленное число роста, чтобы получить новый прогноз ...
вопрос задан: 28 February 2019 20:42
0
ответов

Несколько pandas.pivot_table в один CSV-файл

У меня есть следующие сводные таблицы: средний возраст отсутствия присутствия 53.042017 56.773196 sd 9.601726 7.849503 пол присутствия секс 0.0 0 ....
вопрос задан: 28 February 2019 19:54
0
ответов

Проблемы выбора между определенными часами / минутами в кадре данных

Я не совсем уверен, что происходит, мне нужно найти конкретное время между 20:00:00 и 06:00:00 из кадра данных, изначально он работал, возвращая нужные значения, но когда я пытался настроить ...
вопрос задан: 27 February 2019 21:17
0
ответов

Построить Pandas DataFrame в потоковом режиме

У меня есть большой объем данных в двоичном виде, который я могу читать порциями по одной или нескольким «строкам». Я преобразую эти двоичные строки в строки, которые могут быть поняты Пандами. Я мог прочитать все двоичные файлы ...
вопрос задан: 27 February 2019 17:43
0
ответов

Python Pandas отображает столбец, но записывает в другой столбец в случае исключения

Допустим, у меня есть следующий фрейм данных "df": A | Б | Примечания "ASD" | 1 | "всд" | 1 | "JGY" | 1 | Я создаю другой столбец "C", сопоставляя столбец "A" следующим образом: df ["C"] = df ["A"] ....
вопрос задан: 27 February 2019 17:31
0
ответов

Получить только совпадающие строки для групп в Pandas groupby

У меня есть следующее df: d = {"Col1": ['a', 'd', 'b', 'c', 'a', 'd', 'b', 'c'], "Col2" : ['x', 'y', 'x', 'z', 'x', 'y', 'z', 'y'], "Col3": ['n', 'm', 'm ',' l ',' m ',' m ',' l ',' l '], "Col4": [1,4,2,2,1,4,2,2]} df = pd .. ..
вопрос задан: 27 February 2019 17:11
0
ответов

Как создать сводную таблицу в пандах для этого примера?

У меня есть данные в следующем формате, для которого я хотел бы создать сводную таблицу, используя панд. AGE Good_Bad (30, 45] Хорошо (30, 45] Хорошо (20, 30] Плохо (60, 100] Хорошо (30, 45] Плохо ...
вопрос задан: 27 February 2019 16:33
0
ответов

scipy.optimize.minimize выполняется несколько раз в некоторых строках при применении к фрейму данных Pandas с или без многопроцессорной обработки

Я пытаюсь найти оптимальную точку функции для каждой строки фрейма данных с помощью метода L-BFGS-B spicy.optimize.minimize, я печатаю оптимальную точку для каждой итерации и заметил, что некоторые строки ...
вопрос задан: 26 February 2019 05:44
0
ответов

Сюжетные линии Seaborn, отсортированные по Y-левым значениям

У меня есть данные, которые я группирую по «кластеру», затем сортирую значения по «среднему» и сбрасываю индекс. Результатом этих манипуляций является test: test = pd.DataFrame ({'cluster': ['5', '9', '4'], ...
вопрос задан: 25 February 2019 16:04
0
ответов

Как я могу скопировать данные из фрейма данных «A» в фрейм данных «B»?

У меня есть два кадра данных с одинаковым количеством строк и столбцов. Я хочу скопировать значения из Dataframe A: 0 | 1 | 2 | 3 | ... | 300 | 0 | 1 | 0 | 0 | 0 | «1 | 0 | 1 | 0 | 0 |» 2 | 0 | 0 | 1 | 0 ...
вопрос задан: 25 February 2019 01:52
0
ответов

как преобразовать (JSON) DICT из DICT в CSV и вывести его в таблицу базы данных

Я конвертирую JSON (dict of dict) в CSV, используя Pandas Dataframe. Но так как он имеет dict of dict, другой элемент в результате csv получает двойное значение. Короче 2 записи на 1 запись, которая является дублирующим результатом. ...
вопрос задан: 23 February 2019 14:45
0
ответов

Полоса прокрутки Tkinter не работает: отображение данных с использованием сетки

Я пытаюсь отобразить кадр данных pandas в прокручиваемой сетке tkinter, но полосы прокрутки не работают. Ниже мой код. root = Tk () canvas = Canvas (root, borderwidth = 0) vbar = Полоса прокрутки (root, ...
вопрос задан: 21 February 2019 07:49
0
ответов

Замена значений ячеек в кадре данных панд значениями из списка (векторизация)

Я пытаюсь сделать следующее: Для каждой строки столбца «A», где выполняется условие в столбце «B», я хотел бы заменить значение в столбце «A» первым элементом моего списка «end» а затем удалите ...
вопрос задан: 20 February 2019 10:03