Как преобразовать столбец кадра данных в числовой тип?

Как Вы преобразовываете столбец кадра данных в числовой тип?

247
задан Artem Klevtsov 9 October 2015 в 19:54
поделиться

4 ответа

Поскольку (до сих пор) ни у кого нет галочки, я предполагаю, что у вас есть некоторые практические проблемы, в основном потому, что вы не указали, какой тип вектора вы хотите преобразовать в числовой . Я предлагаю вам применить функцию transform , чтобы выполнить свою задачу.

Теперь я собираюсь продемонстрировать некую «аномалию преобразования»:

# create dummy data.frame
d <- data.frame(char = letters[1:5], 
                fake_char = as.character(1:5), 
                fac = factor(1:5), 
                char_fac = factor(letters[1:5]), 
                num = 1:5, stringsAsFactors = FALSE)

Давайте взглянем на data.frame

> d
  char fake_char fac char_fac num
1    a         1   1        a   1
2    b         2   2        b   2
3    c         3   3        c   3
4    d         4   4        d   4
5    e         5   5        e   5

и запустим:

> sapply(d, mode)
       char   fake_char         fac    char_fac         num 
"character" "character"   "numeric"   "numeric"   "numeric" 
> sapply(d, class)
       char   fake_char         fac    char_fac         num 
"character" "character"    "factor"    "factor"   "integer" 

Теперь вы, вероятно, спросите себя «Где аномалия?» Ну, я наткнулся на довольно странные вещи в R, и это не самая запутанная вещь, но она может сбить вас с толку, особенно если вы прочтете это перед тем, как начать в постель.

Вот и первые два столбца - это символ . Я намеренно вызвал 2 и один fake_char . Обратите внимание на сходство этой переменной символа с той, которую Дирк создал в своем ответе. Фактически это числовой вектор, преобразованный в символ . 3 и 4 столбцы - это фактор , а последний - «чисто» числовой .

Если вы используете функцию transform , вы можете преобразовать fake_char в numeric , но не саму переменную char .

> transform(d, char = as.numeric(char))
  char fake_char fac char_fac num
1   NA         1   1        a   1
2   NA         2   2        b   2
3   NA         3   3        c   3
4   NA         4   4        d   4
5   NA         5   5        e   5
Warning message:
In eval(expr, envir, enclos) : NAs introduced by coercion

но если вы сделаете то же самое с fake_char и char_fac , вам повезет, и вы не потеряете NA:

> transform(d, fake_char = as.numeric(fake_char), 
               char_fac = as.numeric(char_fac))

  char fake_char fac char_fac num
1    a         1   1        1   1
2    b         2   2        2   2
3    c         3   3        3   3
4    d         4   4        4   4
5    e         5   5        5   5

Если вы сохраните преобразованные данные .frame и проверьте режим и класс , вы получите:

> D <- transform(d, fake_char = as.numeric(fake_char), 
                    char_fac = as.numeric(char_fac))

> sapply(D, mode)
       char   fake_char         fac    char_fac         num 
"character"   "numeric"   "numeric"   "numeric"   "numeric" 
> sapply(D, class)
       char   fake_char         fac    char_fac         num 
"character"   "numeric"    "factor"   "numeric"   "integer"

Итак, вывод: Да, вы можете преобразовать символ вектор в числовой , но только если его элементы «конвертируются» в числовой . Если в векторе есть только один символ элемент, вы получите ошибку при попытке преобразовать этот вектор в числовой .

И просто чтобы доказать свою точку зрения:

> err <- c(1, "b", 3, 4, "e")
> mode(err)
[1] "character"
> class(err)
[1] "character"
> char <- as.numeric(err)
Warning message:
NAs introduced by coercion 
> char
[1]  1 NA  3  4 NA

А теперь, просто для развлечения (или практики), попробуйте угадать вывод этих команд:

> fac <- as.factor(err)
> fac
???
> num <- as.numeric(fac)
> num
???

С уважением, Патрик Бернс! =)

257
ответ дан 23 November 2019 в 03:02
поделиться

Тим прав, а у Шейна есть упущение. Вот дополнительные примеры:

R> df <- data.frame(a = as.character(10:15))
R> df <- data.frame(df, num = as.numeric(df$a), 
                        numchr = as.numeric(as.character(df$a)))
R> df
   a num numchr
1 10   1     10
2 11   2     11
3 12   3     12
4 13   4     13
5 14   5     14
6 15   6     15
R> summary(df)
  a          num           numchr    
 10:1   Min.   :1.00   Min.   :10.0  
 11:1   1st Qu.:2.25   1st Qu.:11.2  
 12:1   Median :3.50   Median :12.5  
 13:1   Mean   :3.50   Mean   :12.5  
 14:1   3rd Qu.:4.75   3rd Qu.:13.8  
 15:1   Max.   :6.00   Max.   :15.0  
R> 

Наш data.frame теперь имеет сводку по столбцу факторов (counts) и числовые сводки as.numeric() --- что неправильно, поскольку он получил числовые уровни факторов --- и (правильную) сводку as.numeric(as.character()).

15
ответ дан 23 November 2019 в 03:02
поделиться

Что-то, что мне помогло: если у вас есть диапазоны переменных для преобразования (или всего больше одной), вы можете использовать sapply .

Немного бессмысленно, но только для примера:

data(cars)
cars[, 1:2] <- sapply(cars[, 1:2], as.factor)

Скажем, столбцы 3, 6-15 и 37 вашего фрейма данных необходимо преобразовать в числовой, можно:

dat[, c(3,6:15,37)] <- sapply(dat[, c(3,6:15,37)], as.numeric)
129
ответ дан 23 November 2019 в 03:02
поделиться

if x is the column name of dataframe dat, and x is of type factor, use:

as.numeric(as.character(dat$x))
83
ответ дан 23 November 2019 в 03:02
поделиться
Другие вопросы по тегам:

Похожие вопросы: