2
ответа

Чтение .dat файла и включая пробелы

У меня есть файл .dat, содержащий текст, который я хотел бы в конечном итоге преобразовать в pandas DF. У меня проблема с загрузкой пустых слов в этом файле. В конечном итоге я бы хотел, чтобы это было ...
вопрос задан: 7 March 2019 21:39
2
ответа

Если элемент столбца равен конкретному значению, вставьте новый элемент

Я пытаюсь вставить новый столбец на основе значений в отдельном столбце. Для df ниже у меня есть колонка дней. Если значение в этом столбце равно понедельнику, я хочу вставить 0 в новый ...
вопрос задан: 7 March 2019 15:50
2
ответа

Избегайте итерации по каждой строке в Pandas для пользовательской агрегации

Допустим, у меня есть DataFrame для панд с двумя столбцами: salary и food_perc (процент от зарплаты, которую вы тратите на еду). Каждый ряд соответствует другому человеку. импорт панд как pd импорт numpy ...
вопрос задан: 6 March 2019 21:57
2
ответа

Агрегатный метод и лямбда-функция

У меня есть датафрейм df, и я хотел бы получить список идентификаторов для каждого класса: импортировать панд как pd list1 = [[1, ('A', 'B', 'C')], [2, ('M', «E», «F»)], [3, («H», «A», «D»)], [4, («H», «A», «D»)]] df = .. ,
вопрос задан: 6 March 2019 16:29
2
ответа

Панды читают мультииндексный фрейм данных (обратный to_string ())

У меня есть текстовый файл, который выглядит следующим образом: test2.dat: col1 col2 idx1 idx2 a 0 0.256788 0.862771 1 0.409944 0.785159 2 0.822773 0 ....
вопрос задан: 6 March 2019 14:35
2
ответа

Как построить подразумеваемую проб. матрица распределения Пуассона в питоне

В моем фрейме данных есть два столбца со средними значениями Team_A и Team_B, которые забивают гол в матче. Для каждой строки я хочу создать матрицу 3 на 3, которая покрывает все возможные линии счета, используя Пуассона ...
вопрос задан: 6 March 2019 10:38
2
ответа

Python - Преобразование XML в CSV с использованием Python панд

Я новичок здесь, и я пытался создать небольшой скрипт на Python для преобразования XML в CSV. Основываясь на прочтении различных постов здесь, в Stackoverflow, мне удалось придумать пример кода, который ...
вопрос задан: 6 March 2019 10:05
2
ответа

удаление пунктуации из ряда, содержащего строки, с помощью maketrans / translate

Я хочу удалить пунктуацию из строк в серии. Я использую для этого функции python3.6 и maketrans (), translate (). Тем не менее, это не дает мне результаты, которые я хочу. Вот два ...
вопрос задан: 5 March 2019 18:51
2
ответа

Панды: Широкая в длинную трансформацию: как получить номера строк и столбцов

Вопрос для начинающих: у меня есть матрица, скажем, 3х3, и я хочу преобразовать ее в длинный формат следующим образом: Широкий: A B C A 0,1 0,2 0,3 B 0,1 0,2 0,3 C 0,1 0,2 ...
вопрос задан: 5 March 2019 18:40
2
ответа

Разделение словаря на существующие столбцы

Предположим, у меня есть фрейм данных pd.DataFrame ({'a': nan, 'b': nan, 'c': {'a': 1, 'b': 2}, {'a': 4, 'b' : 7, 'c': nan}, {'a': nan, 'b': nan, 'c': {'a': 6, 'b': 7}}). Я хочу взять значения из ключей в ...
вопрос задан: 5 March 2019 17:40
2
ответа

OneHotEncoder Несколько столбцов

Я пытаюсь закодировать таблицу данных с несколькими столбцами для заданного набора категорий ohe1 = OneHotEncoder (Categories = [list_names_data_rest.values], dtype = 'int8') data_rest1 = ohe1.fit_transform (...
вопрос задан: 5 March 2019 17:07
2
ответа

Конвертировать Pandas Column, который состоит из списка JSON, в новые столбцы

У меня есть DataFrame, который имеет 3 столбца: order_id user_id Подробности 5c7c9 A [{"amount": "160", 'id': 'p2'}, {"amount": "260", 'id': 'p3'}] 5c5c4 B [{"amount": "10", 'id': 'p1'}, {"amount": ...
вопрос задан: 5 March 2019 10:39
2
ответа

Как установить значения столбца на основе нескольких условий в других столбцах в Python?

Я пытался использовать код из многих ответов для подобных вопросов на этот, но я не нашел ничего, что работает для меня, когда я пытаюсь установить несколько условий, которые определяют значение
вопрос задан: 5 March 2019 10:35
2
ответа

Панды широкого формата транспонировать в длинный формат

У меня есть такой фрейм данных pandas со столбцом идентификатора и набором столбцов индикатора (True / False): df_have: ID Мужской Special_Need Teeanger 1 T F T 2 F T ...
вопрос задан: 4 March 2019 19:36
2
ответа

Ошибка типа: несоответствие типов уровня: 0,2. При разделении данных на обучающие, проверочные и тестовые наборы

Добрый день, я пытаюсь обучать, проверять и тестировать данные без использования scikit-learn. Я хочу разделить данные на следующие образцы: данные обучения 0,7 (70%), данные проверки 0,2 (20%) ...
вопрос задан: 4 March 2019 00:54
2
ответа

Python: применить код ко всему столбцу данных

У меня есть столбец col1 в кадре данных, заполненный значениями. col1 row1 [0.0, 6.33839991, 3.93961207, 5.27702178, 8.27702178, 6.44343, 5.668574] ...
вопрос задан: 3 March 2019 18:21
2
ответа

Pandas DataFrames объединяет повторяет значения, чтобы выровнять

Вот ссылка на исходный источник набора данных: набор данных для емкости и набор данных для типа или измененной версии. Набор данных изменен1 и набор данных изменен2.
вопрос задан: 3 March 2019 11:06
2
ответа

Присвойте значения циклам for столбцам DataFrame панд.

Я новичок в Python и у меня проблема с циклом for. Я хочу назначить список номеров для различных столбцов DataFrame. Вручную, я могу присвоить свои значения с правильным кодом, но скопировать и вставить ...
вопрос задан: 3 March 2019 10:06
2
ответа

Эффективный способ проверить dtype каждой строки в серии

Допустим, я смешал ts / другие данные: ser = pd.Series (pd.date_range ('2017/01/05', '2018/01/05')) ser.loc [3] = 4 тип (ser.loc [ 0]) > pandas._libs.tslibs.timestamps.Timestamp Я хотел бы отфильтровать для ...
вопрос задан: 3 March 2019 09:36
2
ответа

Умножение столбцов в отдельном фрейме данных панд на основе одинаковых значений столбцов

Допустим, у меня есть 2 фрейма данных: df1 = pd.DataFrame ({'alpha': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'], 'number': [1, 2, 3, 4, 5, 6, 7, 8, 9]}) буквенное число 0 A 1 1 ...
вопрос задан: 3 March 2019 01:45
2
ответа

Как мне создать новый CSV-файл после слияния четырех в качестве кадра данных?

Я пытаюсь объединить четыре CSV и создать новый с этими данными: импорт панд в виде pd Мой код: df1 = pd.read_csv (r "a.csv") df2 = pd.read_csv (r "b.csv") df3 = pd.read_csv (r "c.csv") df4 = pd.read_csv (r "...
вопрос задан: 2 March 2019 22:17
2
ответа

Pandas / Dataframe: Как назначить значение по умолчанию в случае сбоя условия при получении значения одной ячейки из фрейма данных с использованием python?

Давайте рассмотрим следующий код: импортировать панд как pd df = pd.DataFrame ([[1, 2], [3, 4], [5, 6], [7, 8]], columns = ["A", " B "]) x = 0 print (df) x = df.loc [df ['A'] == 3, 'B', ''] .iloc [0] print (x), в то время как ...
вопрос задан: 2 March 2019 06:32
2
ответа

Выберите 10 лучших записей для каждой категории Python

Как сгруппировать столбец и получить 10 лучших записей в каждой категории в этом столбце? Столбец, который я хочу сгруппировать, имеет 3 категории: «высокий», «средний» и «низкий». У меня есть еще одна колонка с ...
вопрос задан: 2 March 2019 04:30
2
ответа

Сумма TimeField часов / минут с пандами

Я пытаюсь использовать панд для суммирования времени (часы, минуты) серии. Данные поступают из класса TimeField PhoneRecord (models.Model): et = models.TimeField (null = True, пусто = True) В ...
вопрос задан: 2 March 2019 04:14
2
ответа

Использование Pandas join для заполнения столбцов

У меня есть два DataFrames, которые примерно похожи (ID) (Категория) (Значение1) (Значение2) 111 1 5 7 112 1 3 8 113 2 6 9 114 3 2 ...
вопрос задан: 1 March 2019 17:51
2
ответа

Неправильный формат массива при объединении столбцов в новый

У меня есть 3 столбца в кадре данных: df: A | B | C hi | | дорогой Чтобы объединить их в новый столбец D, я сделал: df ['D'] = [[x, y, z] для x, y, z в zip (df.A, df.B, df. C)] К сожалению, результат ...
вопрос задан: 1 March 2019 00:14
2
ответа

Извлечение данных из очень большого текстового файла с использованием Python и панд?

Я пытаюсь извлечь строки из очень большого текстового файла (10 ГБ). Текстовый файл содержит выходные данные инженерного программного обеспечения (это не файл CSV). Я хочу скопировать из строки 1 в первую строку ...
вопрос задан: 28 February 2019 17:41
2
ответа

Python: применить регулярное выражение для кадра данных с датой и временем в виде столбца

У меня есть датафрейм (df), как указано: Index Month Time Text_1 Text_2 Text_3 0 02/2019 19:44:33 aadd @ 34: 9984 (нет) \ 62fa6297-f5f5-4c47-8236 -...
вопрос задан: 28 February 2019 05:55
2
ответа

Панды: удалить строки на основе значения другой строки

У меня есть фрейм данных pandas с именами столбцов: «ID», «datetime», «medication». Теперь я пытаюсь исключить все ряды препаратов морфина в отношении лечения метадоном за данное время. За ...
вопрос задан: 27 February 2019 19:42
2
ответа

Как переименовать значения в столбце из списка?

У меня есть df, который выглядит следующим образом: col1 col2 значение test1 значение test2 значение test3 значение test4 значение test5 Я хочу переименовать col1 из списка повторяющимся образом, как ...
вопрос задан: 27 February 2019 16:02