1
ответ

Как добавить столбец из фрейма данных в другой блок данных в Scala? [Дубликат]

У меня есть кадр данных, например val df = Seq ((«a», «1»), («b», «2»)). ToDF («A», «B») + --- + - + | | B | + --- + --- + | | 1 | | б | 2 | + --- + --- + Другой dataframe df2 как val df2 = Seq (("9"), ("10")) ....
вопрос задан: 9 April 2018 18:14
1
ответ

read_csv неправильно читает имена столбцов в этом файле?

У меня есть CSV-файл следующим образом: 0 5 1 10 2 15 3 20 4 25 Я хочу сохранить его в качестве кадра данных с осями X, Y в качестве имен, а затем построить его. Однако когда я назначаю x, y я получаю испорченный DataFrame, что происходит? ...
вопрос задан: 5 February 2018 00:49
1
ответ

Получить индекс столбца из имени столбца в Python Pandas

В R, когда вам нужно получить индекс столбца, основанный на имени столбца, вы могли бы сделать idx < - which (names (my_data) == my_colum_name) Есть ли способ сделать то же самое с фреймами данных pandas?
вопрос задан: 19 December 2017 02:56
1
ответ

Переименование столбцов в пандах

У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хотел бы изменить имена столбцов в DataFrame A, где исходные имена столбцов: ...
вопрос задан: 12 December 2017 18:55
1
ответ

Как бороться с SettingWithCopyWarning в Pandas?

Фон Я только что обновил свои панды с 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них выглядит так: E: \ FinReporter \ FM_EXT.py: 449: SettingWithCopyWarning: A ...
вопрос задан: 1 December 2017 16:15
1
ответ

Как изменить желаемый формат DataFrame? [Дубликат]

Я хочу изменить формат данных, который я хочу. У меня есть следующие данные. Код Дата закрытия 2007-06-01 600858 33.99 2007-06-04 600858 30.59 2007-06-05 600858 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Преобразование строк в столбцы и одно горячее кодирование в Pandas [duplicate]

У меня есть dataframe вот так: customer_id | дата | категория 1 | 2017-2-1 | игрушки 2 | 2017-2-1 | питание 1 | 2017-2-1 | напитки 3 | 2017-2-2 | компьютер 2 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Как выбрать первый и последний ряд в группирующей переменной в кадре данных?

Как выбрать первый и последний ряд для каждого уникального id в следующем кадре данных? tmp <- structure(list(id = c(15L, 15L, 15L, 15L, 15L, 21L, 21L, 22L, 22L, 22L, 23L, 23L, 23L, 23L, 24L, 24L, 24L, 24L, 24L),...
вопрос задан: 11 October 2017 10:27
1
ответ

Pivoting / Reshaping Dataframe в Pyspark Динамически [дублировать]

У меня есть результат dataframe, как ниже, который я получил из описания + ------- + ------------------ + --------- --------- + ------------------ + | резюме | val1 | val2 | val3 | + ...
вопрос задан: 27 September 2017 16:38
1
ответ

Python находит максимальное значение до текущей строки, фиксируя первую строку [дубликат]

У меня есть dataframe, x y z col 1 2 3 3 2 3 4 4 1 1 3 4 3 3 1 4 1 3 2 4 Итак, для каждой новой строки в «col» мне нужно найти максимум из первой строки ...
вопрос задан: 25 August 2017 10:53
1
ответ

Преобразование из фрейма данных в sf [дубликат]

У меня есть данные ниже, и я хочу преобразовать из data_frame в sf-объект в R. head (RwandanDataset [, 8: 13]) # Размер: 6 x 6 полномочий begin_datetime end_datetime longitude latitude elevation & ...
вопрос задан: 27 May 2017 08:05
1
ответ

Преобразуйте список кадров данных в один кадр данных

У меня есть код, который в одном месте заканчивается со списком кадров данных, которые я действительно хочу преобразовать в единственный кадр больших данных. Я получил некоторые указатели от более раннего вопроса, который пытался сделать...
вопрос задан: 23 May 2017 02:34
1
ответ

Одновременное объединение нескольких data.frames в список

У меня есть список из многих data.frames, которые я хочу объединить. Проблема здесь в том, что каждый data.frame отличается количеством строк и столбцов, но все они имеют общие ключевые переменные (которые я ...
вопрос задан: 23 May 2017 02:18
1
ответ

Как заменить все нулевые значения в dataprame в Pyspark

У меня есть фрейм данных в pyspark с более чем 300 столбцами. В этих столбцах есть несколько столбцов со значениями null. Например: Column_1 column_2 null null null null 234 null 125 ...
вопрос задан: 18 February 2017 07:56
1
ответ

Как я могу сделать DStream после использования foreachrdd ()? [Дубликат]

Примечание. Я не могу переключиться на Structured Streaming, так как он не поддерживает некоторые из компонентов MLLib, которые я использую (KMeans, vectorizers и т. Д.) (Исправьте меня, если я ошибаюсь). Я знаю, что DStreams. ..
вопрос задан: 6 January 2017 15:26
1
ответ

Как выбрать диапазоны столбцов в пандах? [Дубликат]

У меня есть рамка данных панды вида: df 0 1 2 3 .. 60 61 62 63 .. 420 0 A C B F B C A A F 1 B A C E ...
вопрос задан: 21 December 2016 07:52
1
ответ

DataFrame: применить пользовательскую функцию в groupBy [duplicate]

У меня есть Dataframe DF с последующей структурой: DF (тег, значение) и оценка, связанная со всем Dataframe (двойное значение). У меня есть функция, которая принимает параметр Dataframe и счет, ...
вопрос задан: 25 November 2016 01:14
1
ответ

карта в dataframe - pyspark [дубликат]

Здесь я передаю dataframe (CV_data), чтобы добавить метки для Decision Tree def label Данные (данные): # label: row [end], features: row [0: end-1] return data.map (лямбда-строка: LabeledPoint (строка [-1], ...
вопрос задан: 16 September 2016 17:23
1
ответ

Проверка наличия алфавита «A» в каждой ячейке столбца на python. Каждая ячейка содержит строку символов [duplicate]

У меня есть фрейм данных. Исходный фреймворк. Я хочу проверить, присутствует ли символ «A» в каждой ячейке столбца PS и сохранить ответ как 1 или 0 в новом столбце PS_A. Поэтому я преобразовал каждый ...
вопрос задан: 2 September 2016 21:44
1
ответ

Почему Spark дважды читает HDFS? [Дубликат]

У меня есть приложение Spark, которое считывает набор данных из HDFS и выполняет сложную операцию с использованием UDF. Это код: val ds = spark.read.json ("hdfs: //hdfshost/path/to/dataset.json") ....
вопрос задан: 12 August 2016 18:47
1
ответ

PySpark получает вложенный массив из sql Dataframe [duplicate]

У меня есть dataframe из sql, например: + ---- + ---------- + | ID | категория | + ---- + ---------- + | 1 | 1 | | 1 | 2 | | 2 | 4 | | 3 | 1 | | 3 | 4 | + ---- + ---------- + I ...
вопрос задан: 2 June 2016 00:17
1
ответ

Как масштабировать ggplot в R так, чтобы ось y начиналась с 0? [Дубликат]

Я создал DataFrame, DF. (2018-06-25), «2018-06-25», «2018-06-26», «2018-06-26», «2018-06-27», «2018-06» -27 ") температура & lt; - c (" 15 "," 18 "," 16 "," 17 "," 14 "," 15 ") DF - данные ....
вопрос задан: 16 April 2016 20:02
1
ответ

Как рассчитать годы между двумя датами в R? [Дубликат]

Я хочу рассчитать разницу в годах между двумя датами. Вот несколько тестовых данных; O H L C StoHH StoLL K kM 2007-01-02 6220,8 6312,5 6220,8 6310,9 ...
вопрос задан: 25 March 2016 18:36
1
ответ

Используйте ввод пользователя для заполнения следующего раскрывающегося списка [дубликат]

У меня есть dataframe, который мне нужно подмножество дважды для выполнения вычислений. cat1 & lt; -c ('синий', 'красный', 'зеленый', 'синий') cat2 & lt; -c ('шина', 'плоскость', 'автомобиль', 'лодка') num1 & lt; -c ( 123, 153, ...
вопрос задан: 21 January 2016 17:32
1
ответ

Переупорядочьте столбцы кадра данных при игнорировании неопознанных столбцов

Я думаю, там получен, чтобы быть лучшим способом сделать это. Я пытаюсь переупорядочить столбцы в кадре данных. У меня есть список, ordered.colnames, представляя новое упорядочивание - но часть Дона столбцов'...
вопрос задан: 30 December 2015 20:05
1
ответ

Как программно получить внутренний тип контейнера в Джулии? [Дубликат]

Как я могу получить в Julia внутренний тип контейнера, а точнее DataArray? Например, в этом коде: с использованием DataFrames df = DataFrame (a = ["a", "b", "c"], b = [1,2,3], d = [0,1,0,2,0,3]). ,
вопрос задан: 29 October 2015 01:34
1
ответ

Pandas groupby column1 применяет max к столбцу2 и соответствующему значению столбца 3 в результате [duplicate]

У меня есть следующий фреймворк данных: d = {'item_code': ['Item1', 'Item2', 'Item3', 'Item1', 'Item2', 'Item2', 'Item2', 'Item1', 'Item3'] , 'dollar_amount': ['200.25', '350.00', '120.00', '400.50', '1231.25' ...
вопрос задан: 8 September 2015 13:37
1
ответ

Удалить повторяющиеся значения из pandas DataFrame [duplicate]

Я пытаюсь удалить повторяющиеся значения из фрейма данных и не удалять их, как ожидалось. Вот код, который я пробовал ... import pandas as pd df = pd.DataFrame ({«Алфавит»: ['A', 'B', 'C', 'A'], ...
вопрос задан: 1 September 2015 14:49
1
ответ

Капли категории из Dask DataFrame? [Дубликат]

Можно ли отбросить некоторые категории при чтении секционированных данных в Dask DataFrame? Например, я разбил паркет в событиях / год = 2017 / месяц = ​​09 / день = 01 / час = 01 / customer = a.com / xxxx ....
вопрос задан: 7 August 2015 00:47
1
ответ

Regex заменить все несоответствующие буквы пробелом в R [дубликат]

У меня есть кадр данных в формате data & lt; - data.frame (column1 = c ("Y12 (STY): 8.69", "Y5 (STY): 8.69", "Y8: (STY): 0.00"), column2 = c ("T1: (белковый термин): 1000,00", "Q1: Pyro-glufromQ: 1000.00", "Y19: (...
вопрос задан: 21 July 2015 17:48