1
ответ

Добавьте 1, где подстрока присутствует в столбце

У меня есть несколько строк, соединенных в строках столбцов, разделенных '|'. Мне нужно сделать столбцы для каждой из строк. поэтому применили уникальный метод и теперь договоримся с нужными строками, давай ...
вопрос задан: 5 March 2019 19:13
1
ответ

Добавьте метки категорий оттенков в морской полоса

У меня есть два DataFrames, которые я строю как полосу. Я могу изобразить их практически так, как мне хочется, но я хотел бы знать, возможно ли добавить метки категорий для «оттенка». Сюжет ...
вопрос задан: 5 March 2019 18:54
1
ответ

JSON-ответ от повторения нескольких URL для хранения фрейма данных

У меня есть динамический URL-адрес API, используя который каждый URL-адрес получает данные в виде JSON, как показано ниже. {"@type": "connection", "id": "001ZOZ0B00000000006Z", "orgId": "001ZOZ", "...
вопрос задан: 5 March 2019 17:53
1
ответ

Как проверить значение столбца dataframe в списке строк?

У меня есть датафрейм df, и я хочу создать из него новый фрейм данных df_b, но взять только те строки, в которых значение столбца строки df ['id'] находится в моем массиве списков list_of_ids. Оба df ['id'] и ...
вопрос задан: 5 March 2019 17:52
1
ответ

получить значения в скобках или в строке двойных кавычек панд

У меня есть такой фрейм данных, я хотел получить значения в квадратных скобках df = pd.DataFrame ({'User': ['101', '102', '103', '104'], 'Text': [ "" "{" х ": [" 8 "]" "", "" "{" у ": [" 7 "]}" "", "" "[" WW "]" "" ""» "" 10 "]" "" "" ...
вопрос задан: 5 March 2019 17:51
1
ответ

Соединение двух Dataframes по индексу

У меня есть два кадра данных, как показано ниже, и я хотел бы присоединиться к ним, чтобы создать получившийся третий. < & тд GT; df1 & л; / & тд GT; < & таблицы GT; < TBODY > < & тр GT; < & й GT; & Л; / й > & л; е > V1 & ...
вопрос задан: 5 March 2019 17:41
1
ответ

График графика с панда данных

У меня есть датафрейм и я хотел создать линейную диаграмму на одном из столбцов, используя график. У меня есть следующий код, но он не работает df ['col1']. Iplot (kind = 'scatter', filename = 'cufflinks / cf-simple -...
вопрос задан: 5 March 2019 17:36
1
ответ

Как получить значение из рекурсивного вызова с использованием запроса к данным

Я пытаюсь сделать этот поиск между двумя таблицами. С рекурсивным вызовом. Но это всегда возвращает None. Какие могут быть причины? def checkExchangerate (yearEc, monthEc, dayEc, currCode): currCodes = {...
вопрос задан: 5 March 2019 16:58
1
ответ

Процент прогнозирования неверен (логическая ошибка)

В приведенном ниже коде я пытался предсказать вероятность диабета. В разделе, в котором я хочу вычислить процент истинного ложного во фрейме данных, и код для этой обязанности выглядит следующим образом ...
вопрос задан: 5 March 2019 16:43
1
ответ

Matplotlib только график даты в DataFrame?

Как построить график только с датами в моем DataFrame? Я получаю выходные и праздничные дни, которых нет в DataFrame. импортировать matplotlib.pyplot как plt импортировать pandas_datareader.data как веб ...
вопрос задан: 5 March 2019 16:40
1
ответ

Добавьте разделитель запятых в карту температур морского побережья, используя set_text из matplotlib, и держите знак доллара

Я хотел бы добавить разделитель запятых к аннотации, создаваемой следующим кодом, сохраняя знак доллара и используя функции set_text () и get_text (). Я вижу, что t возвращает «текстовый объект» ...
вопрос задан: 5 March 2019 16:36
1
ответ

строка в табличный питон

У меня есть помеченная строка NLP в этом формате: ABC [B-ORG] Финансирование [I-ORG] Анжела [I-PER] Хэм [I-PER] Стокгольм [S-LOC] Главный исполнительный директор \ n Глава XYZ [E -ORG] мне нужно прийти с выводом df ...
вопрос задан: 5 March 2019 16:30
1
ответ

Как найти максимально возможную ковариационную матрицу или самый большой набор столбцов с не пропущенной попарной ковариацией

У меня часто есть данные, где многие наблюдения отсутствуют. И иногда это означает, что у меня есть пары столбцов без перекрывающихся наблюдений, так что я не могу вычислить ковариацию между ними. ...
вопрос задан: 5 March 2019 16:29
1
ответ

Использование панд для чтения файла данных без структуры (без строки заголовка и строк разной длины)

Я читаю данные из файла .dat. И вот пример того, как выглядит набор данных 38 39 41 109 110 39 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 ...
вопрос задан: 5 March 2019 16:28
1
ответ

Построение гистограммы Matplotlib одного столбца данных панд со средним значением другого, представленным точкой

В основном есть pandas dataframe, который выглядит следующим образом: d = {'Percentage': [8,20,24,27, 58], 'Assets': [10,12,53,32,11]} df = pd.DataFrame ( г) я хочу создать гистограмму столбца Процент ...
вопрос задан: 5 March 2019 16:21
1
ответ

новый кадр данных в операторе if. питон

Вот часть кода, с которой у меня возникают проблемы: для диапазона х (len (df ['Days'])): if df ['Days'] [x] > 0 и df ['Days'] [x] < = 30: b = df ['Days'] [x] b Результат, который я получаю: b = 14 ...
вопрос задан: 5 March 2019 15:54
1
ответ

Сортировка каждого столбца на очень большом панде

Я сортирую каждый столбец очень большого кадра данных панд, используя цикл for. Однако этот процесс занимает очень много времени, поскольку в фрейме данных содержится более 1 миллиона столбцов. Я хочу, чтобы этот процесс запустился ...
вопрос задан: 5 March 2019 15:44
1
ответ

Обновите и объедините DataFrame с уровнями иерархии в цикле for

У меня есть набор файлов (25 файлов) в каталоге. Мне нужно загрузить все файлы данных в один DataFrame, не теряя ссылки на имя файла. Файловая структура (df): дата Var1 Var2 Var3 ...
вопрос задан: 5 March 2019 15:21
1
ответ

Рассчитайте разницу в датах между строками и группами по категориям Python

У меня есть набор данных о клиентах и ​​датах покупок, когда несколько клиентов совершали покупки в разные дни. Я хотел бы найти среднюю разницу в днях между покупками для каждой ...
вопрос задан: 5 March 2019 15:19
1
ответ

Переупорядочить ось X для отметок времени после полуночи - Matplotlib

Я пытаюсь построить диапазон значений от панд df. Эти значения взяты из столбцов, которые отображают общее количество значений, возникающих в любой момент времени. Моя попытка ниже. Проблема, которую я ...
вопрос задан: 5 March 2019 11:16
1
ответ

Sklearn PCA: правильная размерность ПК

У меня есть датафрейм, df, который содержит столбец с именем 'event', в котором есть массив 24x24x40. Я хочу: извлечь этот массив NumPy; сплющить его в вектор 1x23040; добавить эту запись как ...
вопрос задан: 5 March 2019 10:39
1
ответ

Загрузка панд с датой между

У меня есть файл .csv со строкой с датой и под данными, которые я хотел бы загрузить в формате df: например: 2018 - 01 - 14 Heure, Column1, Column2, ...., ColumnN 15: 01: 02.000 , 50,30, ..., 50 Есть ли способ ...
вопрос задан: 5 March 2019 10:28
1
ответ

Панды - Получить шаблон, который соответствует URL между двумя фреймами данных

У меня есть 2 кадра данных типа: d1 = {'Domain': ['amazon.com', 'apple.com', 'amazon.com', 'xyz.com'], 'Pattern': ['kindle', 'музыка', 'подпишитесь и сохраните', ''], 'Другая важная информация': ['a', 'b', 'c', 'd']} ...
вопрос задан: 5 March 2019 09:51
1
ответ

Заменить имя столбца Dataframe

У меня есть фрейм данных со столбцами ниже: «ТЕРРИТОРИЯ», «ПОЛЕ ИЗУЧЕНИЯ», «ВЫБЕРИТЕ ГОД Т (АКАДЕМИЧЕСКИЙ ГОД = Т-1 ИЛИ Т)», «ЗНАЧЕНИЕ» Я хочу заменить «ГОД», если имя столбца фрейма данных содержит «ВЫБОР» ГОД". ...
вопрос задан: 5 March 2019 08:11
1
ответ

отсортировать один неполный кадр данных на основе полного кадра данных

У меня есть два кадра данных для задачи классификации. df_x (данные, незаконченная головоломка, с нулями в незаполненных позициях) и df_y (метки, законченная головоломка). У фреймов данных есть несколько ...
вопрос задан: 5 March 2019 08:01
1
ответ

Подсчет строк с 1 или более NaN в Dataframe

У меня есть следующее: print (df.isna (). Sum ()) Что дает мне: город 2 страна 0 тест 0 дом 1807 номер_дома 248 po_box ...
вопрос задан: 5 March 2019 06:09
1
ответ

Каков наиболее эффективный способ хранения списка внутри столбца панд?

У меня есть датафрейм для панд, содержащий 100 миллионов твитов. Я извлек URL-адреса из данных и в настоящее время храню их в виде списка в столбце панд: Dataframe Я хочу провести анализ этих URL-адресов ...
вопрос задан: 5 March 2019 05:17
1
ответ

Создание нового фрейма данных из применения функции ко всей ячейке фрейма данных

У меня есть фрейм данных, df, например: data = {'A': ['Jason (121439)', 'Molly (194439)', 'Tina (114439)', 'Jake (127859)', 'Amy ( 122579) '],' B ': [' Bob (127439) ',' Mark (136489) ',' Tyler (121443) ...
вопрос задан: 5 March 2019 01:07
1
ответ

Как написать файл данных pandas и вставить изображение или диаграмму в одну и ту же книгу Excel, но несколько таблиц

Я уже некоторое время работаю над этой задачей, но мой код работает не так, как я ожидал, поэтому я хотел бы получить небольшую помощь от этого форума. Ниже приведен фрагмент кода, который я написал для этого ...
вопрос задан: 4 March 2019 19:31
1
ответ

Напишите несколько имен столбцов для группы панд по agg

Я хочу создать группу в пандах и вычислить сумму и среднее для нескольких разных столбцов. Ниже приведен пример. grouped = df.groupby (['id']). agg ({'column1': ['sum', '...
вопрос задан: 4 March 2019 17:45