5
ответов

Несколько наблюдений за идентификатор, создание столбца для последнего наблюдения [дубликат]

У меня есть данные, где каждая строка может иметь до 3 наблюдений за измерением. Я пытаюсь создать столбец, который вытаскивает только последнее наблюдение. Например, мои данные выглядят так: Участник x1 x2 ...
вопрос задан: 12 November 2015 06:01
5
ответов

Удалите нули, чтобы создать пустую строку - python, в кадре данных pandas [duplicate]

Как я могу удалить нули, чтобы создать пустую строку в кадре данных pandas? df Col1 Col2 Кетчуп Натан Горчица Корневое пиво Пикантный чай Нант Горчица Горло Пиво Пиво ...
вопрос задан: 10 November 2014 07:29
2
ответа

JSON - > CSV создание строки заголовка и заполнения заголовка, если найдено пустое поле

У меня есть программа на bash, которая получает файлы JSONline с несколькими миллионами этих объектов на строку (см. Источник) {"company_number": "09626947", "data": {"address": {"address_line_1": "...
вопрос задан: 18 March 2019 16:47
2
ответа

Как заменить NA (отсутствующие значения) в кадре данных с соседними значениями

862 19.05.2006 6.241603 5.774208 863 2006-05-20 NA NA 864 2006-05-21 NA NA 865 2006-05-22 6.383929 5.906426 866 2006-05-23 6.782068 6.268758 867 2006-05-24 6....
вопрос задан: 19 March 2017 01:31
2
ответа

Обработка отсутствия/неполных данных в R - является там функцией к маске, но не удаляют NAS?

Поскольку Вы ожидали бы от DSL, нацеленного на анализ данных, R отсутствие/неполные данные дескрипторов очень хорошо, например: Много функций R имеют флаг na.rm, что, когда установлено на ПРАВДА, удалите NAS:>> и...
вопрос задан: 3 December 2015 19:00
1
ответ

Включайте уровни нулевого количества в результате таблицы ()

У меня есть вектор целых чисел между 0 и 5. Я хочу вычислить гистограмму количеств. Например: y <-c (0, 0, 1, 3, 4, 4) таблица (y) # y № 0 1 3 4 # 2 1 1 2 Однако я также хочу результаты к...
вопрос задан: 24 September 2018 12:13
1
ответ

str.format () повышает KeyError

Следующий код повышает исключение KeyError: addr_list_formatted = [] addr_list_idx = 0 для addr в addr_list: # addr_list является списком addr_list_idx = addr_list_idx + 1 addr_list_formatted....
вопрос задан: 1 July 2018 14:51
1
ответ

Удалить строки с пустыми значениями в одном конкретном столбце

Я работаю с большим набором данных, некоторые строки с НА и другие с пробелами: df <- data.frame (ID = c (1: 7), home_pc = c ("", "CB4 2DT", "NE5 7TH", "BY5 ...
вопрос задан: 22 April 2015 07:28
1
ответ

Сделайте снимок экрана окна с помощью C#.NET - недостающая информация о пикселе

Я пытаюсь сделать снимок экрана окна с помощью C#.NET путем вызова Windows API. Я придумал следующий код: общественность освобождает ScreenshotWindow (IntPtr windowHandle) {Rect Rect =...
вопрос задан: 26 July 2010 13:50
0
ответов

Заменить все NA на FALSE в выбранных колонках на R

У меня есть вопрос, похожий на этот, но мой набор данных немного больше: 50 колонок с 1 столбцом в качестве UID и другие колонки с TRUE или NA, я хочу заменить все NA на FALSE, но я не ...
вопрос задан: 12 September 2019 10:54
0
ответов

R: заменить NA элементом из вектора

I Я пытаюсь заменить некоторые недостающие значения в своих данных средними значениями из аналогичной группы. Мои данные выглядят так: X Y 1 х у 2 х у 3 нет данных 4 x y И я хочу, чтобы это выглядело так ...
вопрос задан: 12 September 2019 05:20
0
ответов

Как использовать случайные леса в R с пропущенными значениями?

библиотека (randomForest) rf.model <- randomForest (WIN ~., data = learn) Я хотел бы использовать случайную модель леса, но получаю эту ошибку: Ошибка в na.fail.default (list (WIN = c (2L, 1L, 1L , 2L, 1L, 2L, ...
вопрос задан: 8 July 2019 14:47
0
ответов

Как создать коэффициент пропущенного значения (10%, 20% и т. д.) из полного набора данных в Python

Может кто-нибудь сказать мне, как создавать наборы данных с отсутствующими значениями с разным процентом, как (10%, 20%) из исходных наборов данных в Python.
вопрос задан: 4 April 2019 04:37
0
ответов

Почему я получаю чрезвычайно большие диапазоны, используя функцию imputeData () в пакете mclust в R?

original.dat < - read_sav (file = "N219.sav") Представление (original.dat) все еще получить вмененный набор данных, просто диапазоны для ...
вопрос задан: 22 March 2019 05:10
0
ответов

MySQL: как расширить запрос отсутствующих значений с помощью JOIN

У меня есть таблица tbl_registers, которая содержит идентификатор первичного ключа и внешний ключ collection_id; У меня также есть другая таблица tbl_cross, которая содержит внешний ключ register_id, связанный с tbl_registers и ...
вопрос задан: 17 January 2019 05:08
0
ответов

Быстрые таблицы расчетов в таблице со значениями NA

Я хочу выполнить быстрый расчет таблицы для моей таблицы в Таблице, чтобы рассчитать QoQ для последних двух четвертей моих данных, но мои данные содержат значения NA для одной из переменных, которые меня интересуют.
вопрос задан: 16 January 2019 23:31
0
ответов

Удалить NA значения из вектора

У меня есть огромный вектор, в котором есть несколько NA значений, и я пытаюсь найти максимальное значение в этом векторе (вектор - все числа), но я не могу этого сделать из-за NA значений. Как я могу удалить ...
вопрос задан: 16 January 2019 12:57
0
ответов

В чем разница между x.iloc [1] ['x'] и x ['x']. Iloc [1]

Я не могу изменить значение np.nan на 16 с x.iloc [1] ['x'] = 16, но я могу изменить его с помощью x ['x']. Iloc [1] = 16. Зачем? и в чем разница между этими двумя выражениями? x = pd.DataFrame ({'x': [1, ...
вопрос задан: 16 January 2019 06:00
0
ответов

R Shiny - Динамическая фильтрация из файла CSV - Строки пропали

При использовании фильтрации и функции verbatimTextOutput в R Shiny строки, по-видимому, пропадают, когда я выбираю более одного из вариантов ввода в моем checkboxGroupInput. Ниже мой код. Любые ...
вопрос задан: 31 December 2018 17:45
0
ответов

Удалить строки со всеми или некоторыми NA (отсутствующими значениями) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: a) содержат NA по всем столбцам. Ниже мой пример фрейма данных. ген hsap mmul mmus rnor cfam 1 ENSG00000208234 0 нет данных NA ...
вопрос задан: 12 August 2018 12:32
0
ответов

Замена NA в R ближайшим значением

Я ищу что-то похожее на na.locf() в пакете zoo, но вместо того, чтобы всегда использовать предыдущее значение, отличное от NA, я бы хотел использовать ближайшее значение. значение, отличное от NA. Некоторые примеры данных: dat <- c(1, 3, ...
вопрос задан: 22 July 2018 20:50
0
ответов

Отсутствующие значения в scikits machine learning

Возможно ли иметь отсутствующие значения в scikit-learn? Как они должны быть представлены? Я не смог найти никакой документации об этом.
вопрос задан: 17 October 2017 22:35
0
ответов

Работа с отсутствующими значениями для расчета корреляций

У меня огромная матрица с большим количеством недостающих значений. Я хочу получить корреляцию между переменными. 1. Является ли решение Cor (Na.omit (Matrix)) лучше, чем ниже? Cor (Matrix, use = "Pirewise.complete ....
вопрос задан: 1 June 2017 13:53
0
ответов

Эффективная обработка редко пропущенных данных в Haskell

Я пытаюсь использовать Haskell для анализа данных. Поскольку мои наборы данных достаточно велики (сотни тысяч и, возможно, миллионы наблюдений), в идеале я хотел бы использовать распакованные данные ...
вопрос задан: 23 May 2017 12:29
0
ответов

Как мне поступить с NA в остатках в регрессии R?

Итак, у меня есть некоторые проблемы с некоторыми значениями NA в остатках поперечной регрессии lm в R. Проблема не в самих значениях NA, а в том, как R их представляет. Например: test $ ...
вопрос задан: 20 March 2017 19:12
0
ответов

Вставить недостающие временные ряды в кадр данных

Допустим, у меня есть фрейм данных: df <- data.frame (group = c ('A', 'A', 'A', 'B', 'B', 'B'), время = c (1,2 , 4,1,2,3), data = c (5,6,7,8,9,10)) Что я хочу сделать, это вставить ...
вопрос задан: 30 June 2015 23:50
0
ответов

Как установить поднабор кадра данных, взяв только значения Non NA из 2 столбцов в этом кадре данных

Я пытаюсь установить подкадр данных, используя целочисленные значения в 2 столбца и мой фрейм данных Subs1 <-subset (DATA, DATA [, 2] [! Is.na (DATA [, 2])] & DATA [, 3 ] [! is.na (DATA [, 3])]) но это дает мне ...
вопрос задан: 13 February 2015 09:05
0
ответов

Подмножество фактора по уровням NA

У меня есть фактор в R с уровнем NA. set.seed (1) x <- sample (c (1, 2, NA), 25, replace = TRUE) x <- factor (x, exclude = NULL) > x [1] 1 2 2 1 ...
вопрос задан: 17 May 2014 06:34
0
ответов

Как мне обрабатывать несколько видов пропущенных элементов в R?

Во многих опросах есть коды для разных видов пропущенных данных. Например, кодовая книга может указывать: 0-99 Данные -1 Вопрос не задан -5 Не знаю -7 Отказался отвечать -9 ...
вопрос задан: 25 August 2013 17:03
0
ответов

внутренний временной ряд Северной Америки, зоопарк, R

У меня есть объект зоопарка в R, в котором есть ежедневные данные и отсутствуют выходные. Когда я пытаюсь запустить некоторые функции (, например ar())для объекта, я получаю сообщение об ошибке :mkt.ar <-ar(zoo_object)Ошибка в na....
вопрос задан: 10 August 2012 10:33