У меня проблема. Я хочу получить содержимое файла CSV из URL, а затем проанализировать его в массив. Вот код, который у меня есть сейчас: запросы на импорт импортируют панд как pd import io url = "https: //www.test ....
У меня есть следующий фрейм данных, для которого я использую groupby и sum (): d = {'col1': ["A", "A", "A", "B", "B", "B", "C" , "C", "C"], 'col2': [1,2,3,4,5,6, np.nan, np.nan, np.nan]} df = pd.DataFrame (data = d) ...
У меня есть датафрейм, как показано ниже, и я хочу изменить, как показано ниже, результат df, используя ниже def «apply method» в пандах. Насколько я знаю, метод 'apply' делает серию не вставляющей оригинальный df. id a b -------...
У меня есть этот dataframe: я хочу добавить каждый столбец, как duration + credit_amount, поэтому я создал следующий алгоритм: def automate_add (add): для i, столбец в перечислении (df): для j, operando ...
В настоящее время мне поручено создавать проверки внутри таблицы DataFrame панд разных цветов, когда отображаются определенные данные. Мне удалось найти следующее: < p > я покажу < span ...
У меня есть следующие DataFrame (df): импортировать numpy как np импортировать pandas как pd df = pd.DataFrame (np.random.rand (10, 5)) Я добавляю больше столбцов с помощью присваивания: df ['mean'] = df.mean (1) Как я могу переместить ...
У меня есть два списка, например: list_columns = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'k', 'l' , 'm', 'n'] и список значений list_values = [11,22,33,44,55,66,77,88,99,100, 111, 222] Я хочу создать панд ...
Скажем, у меня есть pandas dataframe, который выглядит следующим образом: номер цвета 0 красный 3 1 синий 4 2 зеленый 2 3 синий 2 Я хочу получить первое значение из столбца чисел, где ...
У меня есть DataFrame с тремя строками: единица измерения, влияние и значение. Существует несколько различных типов влияющих факторов, и значения представляют количество единиц. Я хочу создать новую таблицу с отображением ...
Как получить значение столбца Z и его среднее значение, если какое-либо значение> 1 data = [9,2,3,4,5,6,7,8] df = pd.DataFrame (np.random.randn (8 , 5), столбцы = ['A', 'B', 'C', 'D', 'E']) fd = pd.DataFrame (data, ...
Я пытаюсь создать базу данных с различными фреймами данных панд, которые имеют одинаковый размер. Я хочу назначить каждую точку в кадре данных со всеми другими точками. Такой, что я получаю что-то вроде ...
У меня есть большой CSV-файл, который создается с помощью чужого скрипта с выходными столбцами с именами «D», «B», «A», «C». Есть ли способ прочитать его из CSV напрямую как «A», «B», «C», «D».
У меня есть итеративный процесс, который выполняется с разными значениями параметров на каждой итерации, и я хочу собрать значения параметров и результаты и поместить их в фрейм данных Pandas со встроенным мультииндексом ...
У меня есть фрейм данных с несколькими столбцами, и я хочу найти дубликаты в некоторых из них. Мои столбцы идут от A до Z. Я хочу знать, какие строки имеют одинаковые значения в столбцах A, D, F, K, L и G ....
Я пытаюсь вернуть фрейм данных, в котором мои строки и столбцы, и наоборот. У меня есть следующий код: my_names = [2009,2010,2011,2012,2013,2014,2015,2016,2017,2018] cols = ['link', 'post', 'shared', ...
У меня есть 2 похожих кадра данных, которые я объединил, которые имеют много повторяющихся значений, потому что это в основном один и тот же набор данных, но за разные годы. Проблема в том, что один из наборов имеет некоторые ...
У меня есть следующий фрейм данных: импорт панд как pd, импорт numpy как np data = pd.DataFrame ({'proj': ['A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'], 'country': ['POL', 'POL', '...
У меня есть фрейм данных Pandas с примерно 5 миллионами строк с 2 столбцами "top_level_domain" и "category". Я хотел бы создать новый фрейм данных с различными top_level_domain и ...
У меня есть ключи Name, Id и Major. Есть ли способ сделать значения Name и Id ключом, а Major - значением в словаре? Имя Id Major Joe 001 Math Kyle 002 ...
У меня есть Pandas Dataframe, содержащий автомобили для продажи, и я хотел бы получить наибольшую популярность для каждой марки, однако я, похоже, не могу этого сделать. У меня есть датафрейм pandas с несколькими столбцами (например, транспортное средство
Я пытаюсь очистить свой набор данных pandas, однако я не могу найти способ удалить странные значения с добавлением #, *, x в конце значения. Я хотел бы заменить все эти значения с np.nan. ...
У меня есть форма данных (600 000 * 33). Один из столбцов позволяет назвать его «имя», имеет более 2000 уникальных значений. Я отсортировал столбец, используя приведенный ниже код: got.groupby ('name'). Size (). Sort_values (...