1
ответ

Измените содержимое столбца панд регулярным выражением

У меня есть датафрейм с колонкой, которая выглядит следующим образом Другое через Другое 17 января 2019 года Другое через Другое 17 января 2019 года Интервью по электронной почте 14 декабря 2018 года Отклонено по электронной почте 15 января ...
вопрос задан: 18 January 2019 21:38
1
ответ

Удаление строк в кадре данных, которые ссылаются на идентификаторы, которые не существуют в другом (R)?

У меня есть более концептуальный вопрос. Я ищу способ удаления всей строки из фрейма данных, если он содержит ссылку на данные, которых нет во втором фрейме данных. Код ниже ...
вопрос задан: 18 January 2019 21:11
1
ответ

Pandas df.to_csv () сохраняет старую версию моего файла вместо той, которую я изменил

У меня есть датафрейм, я заменяю NaN и нулевые значения. Все выглядит хорошо, когда он находится в блокноте jupyter, но когда я использую df.to_csv (), он создает в основном копию исходного кадра данных со всеми ...
вопрос задан: 18 January 2019 19:33
1
ответ

Как показать столбец в фрейме данных PySpark в научной нотации в правильном формате

Предположим, что у меня есть датафрейм в pyspark: col1 | col2 | + --------- + --------- + | 3.34567e4 | 45876549 | + --------- + --------- + | 4.4781e8 | 7856549 | + --------- + -...
вопрос задан: 18 January 2019 19:31
1
ответ

Добавьте значение к каждой строке из другого кадра данных неравной длины

У меня есть следующие наборы данных: набор данных1: значение класса Yo 53 сохранить 13 золота 72 Post 88 набор данных 2: класс Total_goals Yo 9 Yo 9 Yo 9 сохранить 4 сохранить 4 Gold ...
вопрос задан: 18 January 2019 18:16
1
ответ

Добавление промежуточных наблюдений во фрейм данных (ручная интерполяция)

У меня есть кадр данных, как показано ниже с векторными координатами: df < - структура (список (x0 = c (22,6, 38,5, 73,7), y0 = c (62,9, 56,6, 27,7), x1 = c (45,8, 49,3) , 80,8), y1 = c (69,9, 21,9, 14)), row.names = c (...
вопрос задан: 18 January 2019 18:02
1
ответ

Python - Как импортировать строки чисел с 0 впереди [дубликаты]

Я импортирую данные из Excel с пандами. Столбец моего dataframe содержит несколько строк чисел с 0 в качестве первого символа и Python преобразует его в целое число. Например 0700 ставится 700 ....
вопрос задан: 18 January 2019 17:22
1
ответ

Перебор нескольких фреймов данных, созданных с помощью & ldquo; locals & rdquo; : Python

Я разделил фрейм данных "df" на более мелкие фреймы данных df1, df2 ... dfn так, чтобы все записи с одинаковым идентификатором (из столбца "UNIT-ID") были сгруппированы и сохранены в этих меньших фреймах данных. Вход: ...
вопрос задан: 18 January 2019 15:33
1
ответ

Итерация по словарю и добавление значений в фрейм данных pandas

Я только что узнал о пандах данных. У меня есть вложенный словарь, который имеет значения, которые я извлекаю в цикле for. Каков наилучший способ преобразовать эти данные в фрейм данных? если результат! = ...
вопрос задан: 18 January 2019 14:11
1
ответ

Как назначить значения дня года, начиная с произвольной даты, и позаботиться об отсутствующих значениях

У меня есть R dataframe df_demand со столбцом даты (depdate) и резервированием столбца зависимой переменной. Продолжительность 365 дней, начиная с 2017-11-02 и заканчивая 2018-11-01, отсортировано по возрастанию ...
вопрос задан: 18 January 2019 13:59
1
ответ

Как установить значение определенного поля в кадре данных панд?

Допустим, у меня есть фрейм данных для панд: d = {'col1': [1, 2, 3, 4], 'col2': ['', '', '', '']} df = pd.DataFrame (data = d) и по какой-то причине я должен перебрать все его строки и дать определенному col2 ...
вопрос задан: 18 January 2019 13:18
1
ответ

Обновите значение столбца первой строки с учетом критериев фильтрации по столбцу в R

У меня сложный вопрос, ответа на который нет нигде. Предположим, у меня есть следующий фрейм данных: индивидуальный gen_check acc loss 1 nnn / nn / nn / nn 2 0,9889 0,0112 2 ...
вопрос задан: 18 January 2019 11:21
1
ответ

Изменить значения одного фрейма данных, используя другой фрейм данных в качестве запроса

df1 = pd.DataFrame (data = {'name': ["John", "Mark", "Alice", "Alice"], 'age': [18, 23, 23, 27], 'luckynumber': [ 10, 20, 30, 40]}) df2 = pd.DataFrame (data = {'name': ["Alice"], 'age': ['23']}) > > > ...
вопрос задан: 18 January 2019 10:54
1
ответ

Как сформировать список кортежей из столбца Dataframe

У меня есть следующий пандас dataframe df с первыми несколькими записями: Входной Выход 0 hj1234 2 1 gu0998 5 2 iu5678 7 3 56h781 11 Мне нужно ...
вопрос задан: 18 January 2019 09:36
1
ответ

как передать имя строки и столбца из двух разных файлов в фрейм данных через R

Есть ли способ создать фрейм данных, указав имя строки и столбца из двух разных файлов. Файл для строк: - sample1_44849 sample2_56479 sample3_98764 sample4_54321 и т. Д. ... Файл для ...
вопрос задан: 18 January 2019 07:28
1
ответ

Случайный выбор строки после поднабора

У меня есть матрица NA 10x3, которая заполняет одну случайную строку случайными числами от 1 до 100. Я хочу выбрать другую случайную строку (без замены, так сказать) и заполнить ее, не зная, какая строка была ...
вопрос задан: 18 January 2019 05:53
1
ответ

фильтрация фрейма данных с использованием сравнения между тремя столбцами этого фрейма данных

Я работаю с фреймом данных, который содержит 1 миллион строк. Я попытался воспроизвести данные как можно проще. Ниже приведен простой фрейм данных. df = pd.DataFrame () df ['Match'] = ['A Vs B', 'A ...
вопрос задан: 18 January 2019 04:16
1
ответ

Эффективное объединение большого количества pyspark DataFrames

Я пытаюсь выполнить объединение тысяч кадров данных в списке Python. Я использую два подхода, которые я нашел. Первый с помощью for loop union, а второй использует functools ....
вопрос задан: 18 January 2019 01:05
1
ответ

Распутывание DataFrame

Мне нужно преобразовать df в другое, являясь оригиналом (df1), вот так: значение A - A 4 A - B 2 A - C 1 B - B 2 C - C 3 D - B .. ,
вопрос задан: 17 January 2019 21:49
1
ответ

найти минимальное значение между 2 условиями в кадре данных

Я очень плохо знаком с Python. У меня длинный вопрос ниже. Буду очень признателен, если вы, ребята, сможете мне помочь. У меня есть большой массив данных с ценами на акции с df.columns = ['open', 'high', 'low', '...
вопрос задан: 17 January 2019 21:30
1
ответ

Как сопоставить столбцы в кадре данных pandas и вывести определенное значение строки

Я пытаюсь сопоставить значение строки в столбце после того, как пользователь введет значение, соответствующее одному значению в строке. Затем выдает некоторую статистику. Например, пользователь вводит название рейса штат 'il' city 'chicago' dest ...
вопрос задан: 17 January 2019 20:55
1
ответ

Как сгруппировать строки по дате во фрейме данных?

У меня есть дата-фрейм news_df с заголовками статей и датами, и я хочу сгруппировать статьи, написанные в один и тот же день, в одну строку. имя дата 2019-01-17 14:41:00 Forte hausse de l '...
вопрос задан: 17 January 2019 15:48
1
ответ

Как добавить имя столбца для временного ряда при индексации

Входные данные: df.info () Выходные данные: < class 'pandas.core.frame.DataFrame' > Индекс: 100 записей, с 2019-01-16 по 2018-08-23 - я хочу добавить это в качестве своего первого столбца к анализу. Столбцы данных (всего 5 ...
вопрос задан: 17 January 2019 14:35
1
ответ

Как перебрать вложенное поле в другом столбце, чтобы создать новый столбец на основе другого значения?

У меня есть столбец в df, который вложен в список json следующим образом: col1 nested-filed 1 [{nested_data}] данные во вложенном поле выглядят так: [{'field': 1, 'timestamp': 1511404149332 ...
вопрос задан: 17 January 2019 14:08
1
ответ

В пандах, как превратить строки в столбцы и назначить значение строк после?

В Python 3 и Pandas у меня есть этот фрейм данных: prop_selec_cleaned.info () < class 'pandas.core.frame.DataFrame' > Int64Index: 146322 записей, от 0 до 146321 столбцов данных (всего 2 столбца): ...
вопрос задан: 17 January 2019 14:07
1
ответ

Python - Как извлечь подмножество при условии первого ряда

Я ищу способ для того, чтобы взять подмножество с условием на получение первой строки с помощью groupby, давайте посмотрим на пример, который будет более понятным: ID Date Diff Class 0 010101 ...
вопрос задан: 17 January 2019 12:39
1
ответ

Лямбда на Питоне 3

У меня есть датафрейм с 2 столбцами, и я хочу разделить его на два массива. Я знаю, что с Python 2 я мог бы использовать это:
вопрос задан: 17 January 2019 11:58
1
ответ

панды, объединяющие 2 кадра данных разного размера, столбцы и частоту

Я пытался объединить 2 кадра данных НФЛ разных размеров и частоты, но 2 одинаковых столбца с именем и годом teiamname. Первый индекс - это название команды и год, а также среднегодовой год, следующий ...
вопрос задан: 17 January 2019 11:40
1
ответ

Как сделать текстовый экстрактор ключевого слова в панде с фреймом данных «другой» более эффективным

Я делаю основанный на txt экстрактор ключевых слов на pandas dataframe с другим как обработчик исключений, но код кажется длинным. Вот описание моего набора данных 1 описание: kartu debit 20/10 ...
вопрос задан: 17 January 2019 11:01
1
ответ

Удалить Pandas столбцы верхнего уровня в иерархическом индексе

У меня есть такой набор данных, как эти данныеПредсказание даты оригинал Группа пред. 2018-09-30 A 2,30 3 2018-10-01 A 1,51 4 2018-10-02 A 2,08 5 2018-10-03 A 1,82 5 ...
вопрос задан: 17 January 2019 10:29