Я был удивлен, узнав, что clara
из library(cluster)
допускают NA. Но в документации к функциям ничего не сказано о том, как она обрабатывает эти значения.
Итак, мои вопросы:
clara
справляется с NA?kmeans
(Nas не разрешен )? [Обновление] Итак, я нашел строки кода в clara
функции:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
которые заменяют отсутствующие значения на valmisdat
. Не уверен, что понимаю причину использования такой формулы. Любые идеи? Было бы более «естественно» обрабатывать NA по каждому столбцу отдельно, возможно, заменяя их средним/медианным?