Рассмотрим следующий файл, разделенный запятыми. Для простоты пусть он содержит одну строку:
'I am quoted','so, can use comma inside - it is not separator here','but can\'t use escaped quote :=('
Если вы попытаетесь прочитать его с помощью команды
table <- read.csv(filename, header=FALSE)
, строка будет разделена на 4 части, потому что строка содержит 3 запятые. На самом деле я хочу для чтения только 3 частей, одна из которых содержит саму запятую. В помощь приходит флаг кавычек. Я пробовал:
table <- read.csv(filename, header=FALSE, quote="'")
, но это дает ошибку «с помощью readTableHeader обнаружена неполная последняя строка в таблице»
. Это происходит из-за нечетного (семи) количества цитат.
прочитано. table ()
, а также scan ()
имеют параметр allowEscapes
, но установка для него значения TRUE
не помогает. Это нормально, потому что из help (scan)
вы можете прочитать:
Интерпретируемые escape-символы являются управляющими символами ‘\a, \b, \f, \n, \r, \t, \v’, ... ... Any other escaped рассматривается как сам символ, включая обратную косую черту
. Предложите, пожалуйста, как бы вы читали такие цитируемые CSV-файлы, содержащие экранированные \ '
кавычки.