У меня есть этот .csv файл:
ID,GRADES,GPA,Teacher,State
3,"C",2,"Teacher3","MA"
1,"A",4,"Teacher1","California"
И то, что я хочу сделать, читается в файле с помощью статистического программного обеспечения R и чтения в Заголовке в некоторый список или массив (я плохо знаком с R и искал, как сделать это, но до сих пор не имел никакой удачи).
Вот некоторый псевдокод того, что я хочу сделать:
inputfile=read.csv("C:/somedirectory")
for eachitem in row1:{
add eachitem to list
}
Затем я хочу смочь использовать те имена для обращения к каждому вертикальному столбцу так, чтобы я мог выполнить вычисления.
Я обыскивал по Google в течение часа, пытаясь узнать как к этому, но нет очень там на контакте с заголовками конкретно.
Спасибо за помощь!
Вы упомянули, что будете обращаться к каждому вертикальному столбцу, чтобы можно было выполнить вычисления. Я предполагаю, что вы просто хотите изучить каждую отдельную переменную. Это можно сделать следующим образом.
df <- read.csv("myRandomFile.csv", header=TRUE)
df$ID
df$GRADES
df$GPA
Может быть полезно просто присвоить данные переменной.
var3 <- df$GPA
Как сказал Дирк, функция, которая вам нужна, это 'read. csv" или один из других вариантов read.table. Учитывая приведенный выше пример данных, я думаю, вы захотите сделать что-то вроде этого:
setwd("c:/random/directory")
df <- read.csv("myRandomFile.csv", header=TRUE)
Все, что мы сделали в приведенном выше примере, это установили каталог, в котором находится ваш файл .csv, а затем прочитали .csv в рамку данных с именем df. Вы можете проверить, что данные загрузились правильно, проверив структуру объекта с помощью:
str(df)
Предположив, что данные загрузились правильно, вы можете приступить к выполнению любого количества статистических методов с данными в вашем фрейме данных. Думаю, summary(df)
будет хорошим местом для начала. Обучение использованию справки в R будет чрезвычайно полезным, а беглое чтение справки на CRAN сэкономит вам много времени в будущем: http://cran.r-project.org/
Вам понадобится read.csv ("C: /somedirectory/some/file.csv")
, и в целом не помешает просмотреть страницу справки. включая его раздел примеров внизу.
Вы можете использовать
df <- read.csv("filename.csv", header=TRUE)
# To loop each column
for (i in 1:ncol(df))
{
dosomething(df[,i])
}
# To loop each row
for (i in 1:nrow(df))
{
dosomething(df[i,])
}
Кроме того, вы можете захотеть взглянуть на функцию apply
(введите ? Apply
или help (применить)
), если вы хотите использовать одну и ту же функцию для каждой строки / столбца