Я пытаюсь открыть файл .csv в кодировке UTF-8, который содержит (традиционные) китайские символы в R. По какой-то причине R иногда отображает информацию как китайские символы, иногда как символы Юникода.
Например:
data <-read.csv("mydata.csv", encoding="UTF-8")
data
будет отображать символы Юникода, а:
data <-read.csv("mydata.csv", encoding="UTF-8")
data[,1]
будет фактически отображать китайские символы.
Если я превращу его в матрицу, он также будет отображать китайские символы, но если я попытаюсь посмотреть данные (команда View(data) или fix(data)) они снова будут в юникоде.
Я обратился за советом к людям, которые используют Mac (я использую ПК, Windows 7), и некоторые из них везде использовали китайские иероглифы, а другие — нет. Вместо этого я попытался сохранить исходные данные в виде таблицы и прочитать их в R таким образом - тот же результат. Я попытался запустить скрипт в RStudio, Revolution R и RGui. Я попытался настроить локаль (например, на китайский), но либо R не позволил мне изменить ее, либо результатом была тарабарщина вместо символов Юникода.
Моя текущая локаль:
"LC_COLLATE=French_Switzerland.1252;LC_CTYPE=French_Switzerland.1252;LC_MONETARY=French_Switzerland.1252;LC_NUMERIC=C;LC_TIME=French_Switzerland.1252"
Любая помощь, чтобы получить R для последовательного будем очень признательны за отображение китайских иероглифов...