1
ответ

PySpark: Преобразование Spark DataFrame в Pandas Dataframe [альтернатива для .toPandas ()] [duplicate]

У меня огромный кадр искровых данных со многими столбцами (PySpark). [количество столбцов около 100 и количество строк более 5000000]. Я хочу преобразовать этот фрейм данных в кадр данных Pandas. Однако, ...
вопрос задан: 22 June 2015 14:55
1
ответ

Как удалить NaN-ы из представления HTML pandas DataFrame? [Дубликат]

Я делаю следующий путь table.fillna ('') table.to_html ('table.html'), и он рисует таблицу, полный fo NaN-s. Как заставить ее отображать пробелы?
вопрос задан: 15 May 2015 20:03
1
ответ

Удалить строки с пустыми значениями в одном конкретном столбце

Я работаю с большим набором данных, некоторые строки с НА и другие с пробелами: df <- data.frame (ID = c (1: 7), home_pc = c ("", "CB4 2DT", "NE5 7TH", "BY5 ...
вопрос задан: 22 April 2015 07:28
1
ответ

Сглаживание категориальных атрибутов в кадре данных в R [дубликат]

Возьмем, к примеру, следующий ввод: [{«name»: «Bob», «superpowers»: [«Stealth», «X-Ray»]}, {«name»: «Mark», «...
вопрос задан: 9 April 2015 01:13
1
ответ

Самый быстрый способ замены NA в большой таблице data.table

У меня есть большая таблица data.table с множеством пропущенных значений, разбросанных по ~ 200 000 строкам и 200 столбцам. Я хотел бы как можно эффективнее перекодировать эти значения NA на нули. два ...
вопрос задан: 25 March 2015 11:37
1
ответ

я хочу изменить отрицательные значения на положительные в столбце dataframe [duplicate]

Я попытался использовать цикл, но он не обновился до df a = df ['differnce'] для строки, значение в перечислении (a): if (value & gt; 0): value == значение else: value = -value print ( стоимость) ...
вопрос задан: 16 March 2015 13:51
1
ответ

применяя замену строк lambda на все строки в python [duplicate]

У меня есть pandas dataframe db3, где я пытаюсь найти функцию, которая может быть применена к каждой строке в ColA, которая заменит oldStrings (если она найдена) на newString. Вывод будет показан ...
вопрос задан: 11 March 2015 13:19
1
ответ

Индексирование фреймов данных Pandas: целые строки, именованные столбцы

Скажем, df - это датафрейм для панд. df.loc [] принимает только имена df.iloc [] принимает только целые числа (фактические места размещения)
вопрос задан: 27 February 2015 22:52
1
ответ

Как создать копию фрейма данных, исключая столбцы списка типов? [Дубликат]

У меня есть кадр данных (df1), который имеет 66 столбцов. Я хочу создать копию фрейма данных (df2), исключая столбцы списка типов. Как я могу это сделать? df2 == df1 минус столбцы списка
вопрос задан: 16 February 2015 19:45
1
ответ

Почему в dataframe pandas автоматически создается первый столбец autonumber [duplicate]

Я новичок в пандах и проверяю Pandas.Dataframe. Я понимаю, что я всегда создаю dataframe, создается первый столбец без заголовка столбца, который также является столбцом индекса. Например ...
вопрос задан: 1 December 2014 22:54
1
ответ

R действительно одержим факторами? [Дубликат]

Может ли кто-нибудь сказать мне, почему R настолько одержим факторами? Все меняется на факторы. x & lt; - as.data.frame (c ("x123", "x234", "x345")) y & lt; - as.data.frame (c ("y123", "y234", "y345")) Для некоторых ...
вопрос задан: 14 September 2014 04:20
1
ответ

Python dataframe Создание нового ключа из столбцов [дубликат]

У меня есть рамка данных pandas, которая похожа на df = pd.DataFrame ({'Страна': ['GER', 'ITA'], '2000': ['1', '4'], '2001': ['2 ',' 5 '],' 2002 ': [' 3 ',' 6 '],}), что означает, что данные похожи на Country 2000 ...
вопрос задан: 29 April 2014 02:48
1
ответ

Как сохранить данные, которые сделаны из Pandas в CSV-файл? [Дубликат]

У меня есть Dataframe, который был построен таким образом: raw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller', ' «Якобсон», «Али», «Милнер», «Кузе»], «...
вопрос задан: 25 February 2014 18:07
1
ответ

Интуитивно-ориентированное вычисление Панды с булевой операцией [дубликат]

Рассмотрим следующий фрагмент кода: & gt; & gt; & gt; & gt; & gt; import pandas as pd & gt; & gt; & gt; & gt; & gt; A = pd.DataFrame ([[1,2], [3,4], [8,9]]) & gt; & gt; & gt; & gt; & gt; A ["result"] = A [0]% 2 == 0 & gt; & gt; & gt; & gt; & gt; & gt;
вопрос задан: 28 January 2014 22:16
1
ответ

Замените некоторые значения столбца блока данных [duplicate]

У меня есть набор данных, из которых одна колонка - дата_обы. В нем есть несколько значений «NaT». Я не знаю, насколько они важны, и я решил заменить их на выбранный ...
вопрос задан: 15 January 2014 20:04
1
ответ

Как напечатать значения не-NaN только? [Дубликат]

Мне было интересно, как распечатать значения, которые не являются NaN. Я видел много сообщений, которые пытаются подсчитать или суммировать результат, но я хочу его отобразить. Этот другой вопрос касается того, как удалить NaN ...
вопрос задан: 27 November 2013 08:31
1
ответ

Как добавить новые переменные в data.frame внутри функции? [Дубликат]

Учитывая data.frame df, полученный в функции myfunc, как я могу добавить еще несколько столбцов в df внутри функции? Он работает, если выполняется вручную вне функции: require («метла») myfunct & ...
вопрос задан: 5 September 2013 17:16
1
ответ

Почему я должен получить ошибку памяти с помощью pandas? [Дубликат]

Я пытаюсь загрузить файл с https://data.medicare.gov/Physician-Compare/Physician-Compare-National-Downloadable-File/mj5m-pzi6 в pandas df. Мой компьютер имеет 16 ГБ оперативной памяти, в то время как этот файл меньше ...
вопрос задан: 16 August 2013 23:18
1
ответ

Почему производительность выбора данных & ldquo; намного лучше & rdquo; на лексикографически отсортированных кадрах данных? [Дубликат]

Я работаю над новым выпуском Wes McKinney Python для анализа данных и на стр. 228 в главе 8 он отмечает, что эффективность выбора данных в пандах «намного лучше» по иерархии ...
вопрос задан: 16 August 2013 09:58
1
ответ

Назначение Dataframe изменяет также другой [дубликат]

Я относительно новичок в python и pandas, поэтому я мог бы наблюдать довольно очевидное. Вот моя проблема: у меня есть исходный dataframe df, который я «клонировал» на два новых фрейма данных df1 и df2. Затем я ...
вопрос задан: 16 November 2012 17:43
1
ответ

Метод создания даты конца месяца из переменной даты в [r] фрейме данных

У меня есть [r] большой фрейм данных с переменными даты, которые отражают первый день месяца. Есть ли простой способ создать новую переменную даты фрейма данных, которая представляет последний день месяца? Ниже ...
вопрос задан: 29 February 2012 17:36
1
ответ

Есть ли в Python модуль, который делает что-то вроде "sqldf" для R?

Понимание списков - это очень хорошо. Но что-то вроде "... Join ..." было бы очень полезно. Спасибо. Например. У меня есть набор A= {1,0}, список B = [[1,1],[2,3]]. Я хотел бы найти все строки в B ...
вопрос задан: 29 December 2011 14:44
1
ответ

Транспонирование фрейма данных с сохранением первого столбца в качестве заголовка

У меня большой фрейм данных, но небольшой пример будет таким: mydf <- data.frame (A = c (буквы [1:10]), M1 = c (11:20), M2 = c (31:40), M3 = c (41:50)) Я хочу транспонировать фрейм данных и поддерживать ...
вопрос задан: 2 November 2011 21:04
1
ответ

Подмножество фрейма данных на основе содержимого другого фрейма данных

У меня есть два data.frames , Для примера скажем, что они выглядят так: df1 <- data.frame (x = rep (letters [1:26], 16)) df2 <- data.frame (y = letters [1: 4]) То, что я хотел бы сделать, это подмножество 'df1' ...
вопрос задан: 23 May 2011 14:11
1
ответ

Как заказать столбец моей файловой системы в соответствии с другой переменной? [dубликат]

У меня есть многогранный график штрихов, и я хочу составить гистограмму с ростом / уменьшением баров и: я хотел бы заказать ось x (x2) для каждой грани независимо от другой переменной (...
вопрос задан: 11 May 2011 17:29
1
ответ

класс в кадр данных в R

Я использую () для оценки функции факторами в моем кадре данных, но я должен использовать результаты в табличной форме. Я видел использование as.data.frame.table для получения объектом класса в кадр данных...
вопрос задан: 17 October 2010 01:44
1
ответ

Создание строки данных R строка за строкой

Я бы хотел построчно построить кадр данных в R. Я провел некоторый поиск, и все, что мне пришло в голову, это предложение создать пустой список, сохранить скалярный индекс списка, а затем каждый раз добавлять к ...
вопрос задан: 17 October 2010 01:41
1
ответ

Удалите строки из кадра данных отдельного столбца

Когда я пытаюсь удалить последнюю строку из кадра данных отдельного столбца, я возвращаю вектор вместо кадра данных:> df = data.frame (a=1:10)> df 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8...
вопрос задан: 12 July 2010 21:51
1
ответ

Как преобразовать данные XML в data.frame?

Я пытаюсь изучить XML-пакет R. Я пытаюсь создать data.frame из демонстрационного файла данных XML books.xml. Вот то, что я получаю: библиотека (XML) книги <-документ "http://www.w3schools.com/XQuery/books.xml"...
вопрос задан: 15 January 2010 15:03
0
ответов

Вычислить процентную статистику по столбцу в фрейме данных (табличная функция, дополненная процентами)

Это простой вопрос, но я не мог понять, как использовать prop.table для это и мне очень очень часто нужен этот функционал. У меня есть такие данные > library(ggplot2) > #sample data(tips...
вопрос задан: 7 November 2019 07:48