кластеризация со значениями NA в R

Я был удивлен, узнав, что claraиз library(cluster)допускают NA. Но в документации к функциям ничего не сказано о том, как она обрабатывает эти значения.

Итак, мои вопросы:

  1. Как claraсправляется с NA?
  2. Можно ли это как-то использовать дляkmeans(Nas не разрешен )?

[Обновление] Итак, я нашел строки кода в claraфункции:

inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat

которые заменяют отсутствующие значения на valmisdat. Не уверен, что понимаю причину использования такой формулы. Любые идеи? Было бы более «естественно» обрабатывать NA по каждому столбцу отдельно, возможно, заменяя их средним/медианным?

11
задан danas.zuokas 24 May 2012 в 07:11
поделиться