Как читать цитируемый текст, содержащий экранированные кавычки

Рассмотрим следующий файл, разделенный запятыми. Для простоты пусть он содержит одну строку:


'I am quoted','so, can use comma inside - it is not separator here','but can\'t use escaped quote :=('

Если вы попытаетесь прочитать его с помощью команды

table <- read.csv(filename, header=FALSE)

, строка будет разделена на 4 части, потому что строка содержит 3 запятые. На самом деле я хочу для чтения только 3 частей, одна из которых содержит саму запятую. В помощь приходит флаг кавычек. Я пробовал:

table <- read.csv(filename, header=FALSE, quote="'")

, но это дает ошибку «с помощью readTableHeader обнаружена неполная последняя строка в таблице» . Это происходит из-за нечетного (семи) количества цитат.

прочитано. table () , а также scan () имеют параметр allowEscapes , но установка для него значения TRUE не помогает. Это нормально, потому что из help (scan) вы можете прочитать:

Интерпретируемые escape-символы являются управляющими символами ‘\a, \b, \f, \n, \r, \t, \v’, ... ... Any other escaped рассматривается как сам символ, включая обратную косую черту

. Предложите, пожалуйста, как бы вы читали такие цитируемые CSV-файлы, содержащие экранированные \ ' кавычки.

11
задан smci 22 September 2016 в 04:28
поделиться