Подмножество строк, содержащих значения NA (отсутствующие) в выбранном столбце фрейма данных

У нас есть фрейм данных из файла CSV. Фрейм данных DF имеет столбцы, содержащие наблюдаемые значения, и столбец ( VaR2 ), содержащий дату, когда было выполнено измерение. Если дата не была записана, CSV-файл содержит значение NA для отсутствующих данных.

Var1  Var2 
10   2010/01/01
20   NA
30   2010/03/01

Мы хотели бы использовать команду subset для определения нового фрейма данных new_DF , чтобы он содержал только строки, которые имеют значение NA ' из столбца ( VaR2 ). В приведенном примере только строка 2 будет содержаться в новом DF .

Команда

new_DF<-subset(DF,DF$Var2=="NA") 

не работает, итоговый фрейм данных не имеет записей строк.

Если в исходном файле CSV значение NA заменяется на NULL , та же команда дает желаемый результат: new_DF <-subset (DF, DF $ Var2 == "NULL") .

Как я могу заставить этот метод работать, если для символьной строки значение NA указано в исходном CSV-файле?

87
задан Mars 23 January 2015 в 22:57
поделиться