0
ответов

Как конвертировать сводную таблицу в df с помощью PySpark

У меня следующая проблема: я использую PySpark для чтения таблицы из Snowflake в качестве кадра данных. Затем я выполняю pivot в кадре данных. После этого я хочу преобразовать объект сводки обратно в фрейм данных ...
вопрос задан: 5 April 2019 04:40
0
ответов

Наиболее эффективный способ взрыва столбца данных Pyspark

У меня очень большой фрейм данных pyspark. Фрейм данных содержит два важных столбца: ключ и токены, связанные с этим ключом. Таким образом, в каждой строке есть ключ и список токенов: load_df.show (5) + -----------------...
вопрос задан: 30 March 2019 22:47
0
ответов

Как назвать строки и столбцы в кадре данных перед экспортом в Excel?

импорт панд как pd df1 = pd.DataFrame (Numpy_Array1) df2 = pd.DataFrame (Numpy_Array2) writer = pd.ExcelWriter ('Results.xlsx', engine = 'xlsxwriter') df1.to_excel (writer, sheet_name = 'Array1) df2 ....
вопрос задан: 28 March 2019 11:22
0
ответов

Как позволить пользователю создавать поля и сохранять записи как списки выбора? - Джанго каркас отдыха

Я хотел бы создать систему управления, когда я создаю проект, проект содержит много TaskGroup, таких как «To do», «Doing» и «Done», и который является типом TaskGroup по умолчанию, который называется ...
вопрос задан: 28 March 2019 06:22
0
ответов

линейная проверка количества повторяющихся данных в серии

Я пытаюсь подсчитать, сколько повторных данных есть в каждом столбце в DataFrame. Это питон 3.7. Я пробовал df_.count (), но он предназначен для оси. Я ожидаю, что результат будет выглядеть так: ...
вопрос задан: 28 March 2019 03:33
0
ответов

Написать таблицу панд в pdf

Я пытаюсь написать таблицу панд, написанную с таблицей в PDF или текст. У меня проблемы с этим, потому что большинство авторов PDF-файлов выдают мне ошибку об Unicode. Любых предложений было бы много ...
вопрос задан: 28 March 2019 01:46
0
ответов

Ошибка повторной выборки панд в AWS Ubuntu?

AWS Ubuntu 18.04 Когда я запускаю следующую программу на моей локальной машине, она работает без проблем. Однако на AWS выдает ошибку памяти. Я видел кучу вопросов / ответов, но ни один из них, казалось, не ...
вопрос задан: 27 March 2019 11:20
0
ответов

Как я могу преобразовать фрейм данных с несколькими возможными значениями в одном столбце в более двоичные объекты? [Дубликат]

Рассмотрим следующий кадр данных панд, в [1]: d = {'ID': [1, 1, 1, 2, 3, 4, 4], 'PROPERTY': ['A', 'B', 'C' , 'A', 'D', 'A', 'B']} В [2]: test_df = pd.DataFrame (data = d) В [3]: test_df Out [3]: ID ...
вопрос задан: 25 March 2019 17:18
0
ответов

Расчет последнего значения для таймфрейма

У меня есть таблица, где мне нужно рассчитать максимальное значение последнего значения в скользящий период времени 15 минут. Ожидаемый столбец - это столбец «MAX». Я хотел бы получить максимальное значение Last для ...
вопрос задан: 25 March 2019 15:39
0
ответов

Выбрать по частичной строке из кадра данных pandas

У меня есть DataFrame с 4 столбцами, 2 из которых содержат строковые значения. Мне было интересно, есть ли способ выбрать строки на основе частичного совпадения строк с определенным столбцом? Иными словами, а...
вопрос задан: 25 March 2019 00:22
0
ответов

Повышение дискретизации в Python: Действует только с DatetimeIndex, TimedeltaIndex или PeriodIndex, но получил экземпляр RangeIndex

Я пытаюсь повысить частоту этих данных до ежедневной. Идея состоит в том, чтобы поставить нулевые значения для элементов с повышенной дискретизацией. Я получаю следующую ошибку в моей оболочке: 'TypeError: Действителен только с DatetimeIndex, ...
вопрос задан: 24 March 2019 21:07
0
ответов

умножить выбранный столбец данных

У меня есть два фрейма данных, а именно акции и Log_Returns. Я хочу умножить первую цифру акций на 1-й столбец Log_Returns. 2-я цифра акций со 2-м столбцом и т. Д. Я пытался за цикл, но ...
вопрос задан: 24 March 2019 05:55
0
ответов

Проблемы с загрузкой str.get_dummies () panda df из csv

У меня есть файл CSV, содержание которого содержит экспертов и список навыков, которые он / она знает примерно так: 0 «Производительность», «Данные» 1, «Компиляция», «Алгоритмы», 3 «Данные», «Алгоритмы».
вопрос задан: 23 March 2019 20:11
0
ответов

Dask: преобразование DataFrame отношения «многие ко многим»

У меня есть DataFrame, как показано ниже. > print (df_user_preferences) user_id food_id int64 int64 int64 ... Этот информационный кадр представляет отношение «многие ко многим» между пользователем и продуктом питания. Там ...
вопрос задан: 22 March 2019 10:30
0
ответов

сохранить случайное наименьшее значение на строку в наборе данных Python Pandas

У меня есть dataframe, где каждая строка ранжируется по нескольким атрибутам по сравнению со всеми другими строками Одна строка может иметь одинаковый ранг в 2 атрибутах (то есть строка может быть лучшей в нескольких атрибутах), например
вопрос задан: 21 March 2019 09:48
0
ответов

Подмножество оставшегося кадра данных, используя другое подмножество

У меня есть образец набора данных. Я создал подмножество исходного фрейма данных с использованием некоторого условия. Теперь мне нужно извлечь оставшееся содержимое исходного образца данных, кроме подмножества ...
вопрос задан: 20 March 2019 11:17
0
ответов

Как использовать df.apply (), передавая выбранные столбцы данных в другую функцию

У меня есть датафрейм с несколькими столбцами. Два столбца в кадре данных - это имя_таблицы и имя_столбца. Мне нужно проверить, доступно ли column_name в table_name в SQL Server ...
вопрос задан: 20 March 2019 08:58
0
ответов

У меня странный вывод при использовании to_csv

У меня странный вывод при использовании to_csv код, который я запускаю, выглядит следующим образом. импортировать панд как pd импортировать numpy как np df = pd.DataFrame () символ _ = 'SHFE.rb1906' сторона _ = 'long' dtStr = '2019-03-20 9: ...
вопрос задан: 20 March 2019 07:06
0
ответов

hvplot.heatmap с пандой dataframe: Как указать значения измерений?

У меня есть простой фрейм данных со столбцами и строками, которые я хочу визуализировать с помощью hvpolot.heatmap. Я могу сделать что-то похожее с: df.style.background_gradient (cmap = 'summer') .. в Jupyter, ...
вопрос задан: 20 March 2019 06:32
0
ответов

Исключение: данные должны быть одномерными при создании фрейма данных из списка

Я пытаюсь создать фрейм данных из списков и получаю следующее исключение: Исключение: данные должны быть одномерными
вопрос задан: 20 March 2019 05:01
0
ответов

R: Функция для передачи переменных в кадре данных в вектор не работает

Так что я очень плохо знаком с R и пытался втиснуть некоторые знания R в свой мозг для проекта на моей работе. Я все еще изучаю основы и не могу понять, почему моя функция не будет работать. Я ...
вопрос задан: 20 March 2019 03:55
0
ответов

Как оптимизировать скорость Pandas DataFrame?

У меня есть этот код панд, но он очень медленный. Как я мог оптимизировать это? Это означает, что когда я запускаю его, это занимает около 4 секунд. Этот код я называю здесь, это то, что я называю снова и снова, и это ...
вопрос задан: 19 March 2019 16:42
0
ответов

Как преобразовать объект фильтра типа в dataframe в Python?

Я хочу использовать функцию фильтра для фильтрации строк в кадре данных. Код выглядит следующим образом: f15_ABC = фильтр (лямбда х: х [0: 3] == "ABC", f15 ['var1']) Поэтому я хочу получить датафрейм только со строками, где ...
вопрос задан: 19 March 2019 09:29
0
ответов

Упорядочить имена столбцов в R по произвольно заданному порядку [дубликат]

Возможный дубликат: Как отсортировать фрейм данных по столбцу(ам) в R Вот набор данных: odervect <- c("xaf", "c3a", "c3b", "ka101", "jk12", "cd101", "kl01v", "klm1") odervect [1] "xaf" "c3a" "...
вопрос задан: 17 March 2019 12:12
0
ответов

Преобразование данных из длинного формата в широкий формат с несколькими столбцами показателей

У меня возникли проблемы с определением наиболее элегантного и гибкого способа переключения данных из длинного формата в широкий формат, когда у меня есть более одной переменной измерения, которую я хочу взять с собой. Например, вот...
вопрос задан: 15 March 2019 14:38
0
ответов

Итерация по фрейму данных и извлечение специальных символов

school_earning_premium_hourly dips_cert_earning_premium_weekly 5.785123966942149 \ B 110.7438016528926 \ У меня есть несколько столбцов (2 из них выше) в моем фрейме данных. Мне нужен способ ...
вопрос задан: 13 March 2019 10:52
0
ответов

Одинаковый код DataFrame.reindex - другой вывод

Добрый день всем, я хочу отфильтровать из DataFrame столбцы, которые мне не интересны. Для этого - и так как столбцы могут меняться в зависимости от ввода пользователя (что я не буду здесь показывать) ...
вопрос задан: 11 March 2019 14:59
0
ответов

Чем отличаются iloc, ix и loc?

Может кто-нибудь объяснить, чем эти три метода нарезки отличаются? Я видел документы, и я видел эти ответы, но я все еще не могу объяснить, чем они отличаются. Мне, ...
вопрос задан: 8 March 2019 17:41
0
ответов

Как получить количество столбцов в кадре данных Pandas?

Как программно получить количество столбцов в кадре данных pandas? Я надеялся на что-то вроде: df.num_columns
вопрос задан: 8 March 2019 17:31
0
ответов

выбрать столбцы на основе нескольких условий в Pandas

Как перевести оператор SQL в Pandas: выберите PolicyNumber, Coverage из ClaimsData, где AccidentState = 'AZ' и Coverage = 'Liability' Я знаю, как выбирать столбцы для одного ...
вопрос задан: 8 March 2019 06:06