Как Вы преобразовываете столбец кадра данных в числовой тип?
Поскольку (до сих пор) ни у кого нет галочки, я предполагаю, что у вас есть некоторые практические проблемы, в основном потому, что вы не указали, какой тип вектора вы хотите преобразовать в числовой
. Я предлагаю вам применить функцию transform
, чтобы выполнить свою задачу.
Теперь я собираюсь продемонстрировать некую «аномалию преобразования»:
# create dummy data.frame
d <- data.frame(char = letters[1:5],
fake_char = as.character(1:5),
fac = factor(1:5),
char_fac = factor(letters[1:5]),
num = 1:5, stringsAsFactors = FALSE)
Давайте взглянем на data.frame
> d
char fake_char fac char_fac num
1 a 1 1 a 1
2 b 2 2 b 2
3 c 3 3 c 3
4 d 4 4 d 4
5 e 5 5 e 5
и запустим:
> sapply(d, mode)
char fake_char fac char_fac num
"character" "character" "numeric" "numeric" "numeric"
> sapply(d, class)
char fake_char fac char_fac num
"character" "character" "factor" "factor" "integer"
Теперь вы, вероятно, спросите себя «Где аномалия?» Ну, я наткнулся на довольно странные вещи в R, и это не самая запутанная вещь, но она может сбить вас с толку, особенно если вы прочтете это перед тем, как начать в постель.
Вот и первые два столбца - это символ
. Я намеренно вызвал 2 и один fake_char
. Обратите внимание на сходство этой переменной символа
с той, которую Дирк создал в своем ответе. Фактически это числовой
вектор, преобразованный в символ
. 3 -й и 4 -й столбцы - это фактор
, а последний - «чисто» числовой
.
Если вы используете функцию transform
, вы можете преобразовать fake_char
в numeric
, но не саму переменную char
.
> transform(d, char = as.numeric(char))
char fake_char fac char_fac num
1 NA 1 1 a 1
2 NA 2 2 b 2
3 NA 3 3 c 3
4 NA 4 4 d 4
5 NA 5 5 e 5
Warning message:
In eval(expr, envir, enclos) : NAs introduced by coercion
но если вы сделаете то же самое с fake_char
и char_fac
, вам повезет, и вы не потеряете NA:
> transform(d, fake_char = as.numeric(fake_char),
char_fac = as.numeric(char_fac))
char fake_char fac char_fac num
1 a 1 1 1 1
2 b 2 2 2 2
3 c 3 3 3 3
4 d 4 4 4 4
5 e 5 5 5 5
Если вы сохраните преобразованные данные .frame
и проверьте режим
и класс
, вы получите:
> D <- transform(d, fake_char = as.numeric(fake_char),
char_fac = as.numeric(char_fac))
> sapply(D, mode)
char fake_char fac char_fac num
"character" "numeric" "numeric" "numeric" "numeric"
> sapply(D, class)
char fake_char fac char_fac num
"character" "numeric" "factor" "numeric" "integer"
Итак, вывод: Да, вы можете преобразовать символ
вектор в числовой
, но только если его элементы «конвертируются» в числовой
. Если в векторе есть только один символ
элемент, вы получите ошибку при попытке преобразовать этот вектор в числовой
.
И просто чтобы доказать свою точку зрения:
> err <- c(1, "b", 3, 4, "e")
> mode(err)
[1] "character"
> class(err)
[1] "character"
> char <- as.numeric(err)
Warning message:
NAs introduced by coercion
> char
[1] 1 NA 3 4 NA
А теперь, просто для развлечения (или практики), попробуйте угадать вывод этих команд:
> fac <- as.factor(err)
> fac
???
> num <- as.numeric(fac)
> num
???
С уважением, Патрик Бернс! =)
Тим прав, а у Шейна есть упущение. Вот дополнительные примеры:
R> df <- data.frame(a = as.character(10:15))
R> df <- data.frame(df, num = as.numeric(df$a),
numchr = as.numeric(as.character(df$a)))
R> df
a num numchr
1 10 1 10
2 11 2 11
3 12 3 12
4 13 4 13
5 14 5 14
6 15 6 15
R> summary(df)
a num numchr
10:1 Min. :1.00 Min. :10.0
11:1 1st Qu.:2.25 1st Qu.:11.2
12:1 Median :3.50 Median :12.5
13:1 Mean :3.50 Mean :12.5
14:1 3rd Qu.:4.75 3rd Qu.:13.8
15:1 Max. :6.00 Max. :15.0
R>
Наш data.frame
теперь имеет сводку по столбцу факторов (counts) и числовые сводки as.numeric()
--- что неправильно, поскольку он получил числовые уровни факторов --- и (правильную) сводку as.numeric(as.character())
.
Что-то, что мне помогло: если у вас есть диапазоны переменных для преобразования (или всего больше одной), вы можете использовать sapply
.
Немного бессмысленно, но только для примера:
data(cars)
cars[, 1:2] <- sapply(cars[, 1:2], as.factor)
Скажем, столбцы 3, 6-15 и 37 вашего фрейма данных необходимо преобразовать в числовой, можно:
dat[, c(3,6:15,37)] <- sapply(dat[, c(3,6:15,37)], as.numeric)
if x
is the column name of dataframe dat
, and x
is of type factor, use:
as.numeric(as.character(dat$x))