Набор данных, в котором я хочу читать, содержит числа с и без запятой как тысяча разделителя:
"Sudan", "15,276,000", "14,098,000", "13,509,000"
"Chad", 209000, 196000, 190000
и я ищу способ считать эти данные в.
Любая подсказка ценится!
поскольку под вопросом стоит тег "r", я предполагаю, что это вопрос R. В R вам не нужно ничего делать для обработки кавычек:
> read.csv('t.csv', header=F)
V1 V2 V3 V4
1 Sudan 15,276,000 14,098,000 13,509,000
2 Chad 209000 196000 190000
# if you want to convert them to numbers:
> df <- read.csv('t.csv', header=F, stringsAsFactor=F)
> df$V2 <- as.numeric(gsub(',', '', df$V2))
Глядя на этот набор данных, вы можете проанализировать его, используя "," (обратите внимание на лишний пробел) в качестве разделителя между ","
Вы можете использовать следующее регулярное выражение, чтобы удалить запятые и любые окружающие кавычки, чтобы оставить простой CSV-контент
,(?=[0-9])|"
, а затем обработать его как обычно
Как насчет того, чтобы сделать это как двухэтапный процесс? 1. Замените "," символом TAB 2. Разделить на вкладку.
Я предполагаю, что здесь .NET, но примерный принцип применим к любому языку