Я в тупике. Обычно read.csv
работает так, как ожидалось, но я столкнулся с проблемой, когда поведение неожиданное. Скорее всего, это ошибка пользователя с моей стороны, но любая помощь будет оценена по достоинству.
Вот URL файла
http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip
Вот мой код, чтобы получить файл, разархивировать и прочитать его в:
URL <- "http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip"
download.file(URL, destfile="temp.zip")
unzip("temp.zip")
tmp <- read.table("sfa0910.csv",
header=T, stringsAsFactors=F, sep=",", row.names=NULL)
Вот моя проблема. Когда я открываю данные csv в Excel, данные выглядят так, как ожидалось. Когда я читаю данные в R, первый столбец на самом деле называется row.names. R читает одну дополнительную строку данных, но я не могу понять, где возникает «ошибка», из-за которой row.names является столбцом. Просто похоже, что данные переместились.
Однако странно то, что последний столбец в R действительно содержит правильные данные.
Вот несколько строк из первых нескольких столбцов:
tmp[1:5,1:7]
row.names UNITID XSCUGRAD SCUGRAD XSCUGFFN SCUGFFN XSCUGFFP
1 100654 R 4496 R 1044 R 23
2 100663 R 10646 R 1496 R 14
3 100690 R 380 R 5 R 1
4 100706 R 6119 R 774 R 13
5 100724 R 4638 R 1209 R 26
Любые мысли о том, что я могу делать неправильно?