Как мне обрабатывать несколько видов пропущенных элементов в R?

Во многих опросах есть коды для различных видов отсутствия. Например, в кодовой книге может быть указано:

0-99 Данные

-1 Вопрос не задан

-5 Не знаю

-7 Отказался отвечать

-9 Модуль не задан

У Stata есть прекрасное средство для обработки этих множественных видов отсутствия, так как она позволяет вам назначать общий. к отсутствующим данным, но допускаются и более конкретные виды отсутствия (.a, .b, .c, ..., .z). Все команды, которые просматривают отчет об отсутствии, отвечают на все отсутствующие записи, как бы они ни были указаны, но вы также можете отсортировать различные виды отсутствующих записей позже. Это особенно полезно, если вы считаете, что отказ отвечать имеет иные последствия для стратегии вменения, чем не заданный вопрос.

Я никогда не сталкивался с такой возможностью в R, но мне бы очень хотелось иметь такую ​​возможность. Есть ли способы обозначить несколько разных типов NA? Я мог бы представить себе создание большего количества данных (либо вектор длины nrow (my.data.frame), содержащий типы отсутствующих типов, либо более компактный индекс того, какие строки имели какие типы отсутствующих данных), но это кажется довольно громоздким.

19
задан Metrics 25 August 2013 в 17:03
поделиться