Отображение китайских символов в кодировке UTF-8 в R

Я пытаюсь открыть файл .csv в кодировке UTF-8, который содержит (традиционные) китайские символы в R. По какой-то причине R иногда отображает информацию как китайские символы, иногда как символы Юникода.

Например:

data <-read.csv("mydata.csv", encoding="UTF-8")

data

будет отображать символы Юникода, а:

data <-read.csv("mydata.csv", encoding="UTF-8")

data[,1]

будет фактически отображать китайские символы.

Если я превращу его в матрицу, он также будет отображать китайские символы, но если я попытаюсь посмотреть данные (команда View(data) или fix(data)) они снова будут в юникоде.

Я обратился за советом к людям, которые используют Mac (я использую ПК, Windows 7), и некоторые из них везде использовали китайские иероглифы, а другие — нет. Вместо этого я попытался сохранить исходные данные в виде таблицы и прочитать их в R таким образом - тот же результат. Я попытался запустить скрипт в RStudio, Revolution R и RGui. Я попытался настроить локаль (например, на китайский), но либо R не позволил мне изменить ее, либо результатом была тарабарщина вместо символов Юникода.

Моя текущая локаль:

"LC_COLLATE=French_Switzerland.1252;LC_CTYPE=French_Switzerland.1252;LC_MONETARY=French_Switzerland.1252;LC_NUMERIC=C;LC_TIME=French_Switzerland.1252"

Любая помощь, чтобы получить R для последовательного будем очень признательны за отображение китайских иероглифов...

8
задан Levon 8 June 2012 в 20:24
поделиться