0
ответов

Как прочитать текстовый файл utf16 в строку в golang?

Я могу прочитать файл в массив байтов, но когда я конвертирую его в строку, он обрабатывает байты utf16 как ascii. Как правильно конвертировать его? основной импорт пакета ("fmt" "os" "bufio") func main () {// ...
вопрос задан: 4 April 2013 13:07
0
ответов

Utf8_general_ci или utf8mb4 или & hellip ;?

utf16 или utf32? Я пытаюсь хранить контент на многих языках. В некоторых языках используются шрифты двойной ширины (например, японские шрифты часто в два раза шире английских шрифтов). Я не ...
вопрос задан: 7 August 2012 06:46
0
ответов

Использование iconv для преобразования из UTF -16BE в UTF -8 без спецификации

Я пытаюсь преобразовать кодированный файл UTF -16BE (метку порядка байтов :0xFE 0xFF )в UTF -8, используя iconv вот так :iconv -f UTF -16BE -t UTF -8 myfile.txt Результирующий вывод, однако, имеет порядок 8 байтов UTF -...
вопрос задан: 20 July 2012 01:31
0
ответов

Размер wchar _t *для суррогатной пары (Символ Unicode из BMP )в Windows

Я столкнулся с интересной проблемой в Windows 8. Я проверил, могу ли я представлять символы Unicode, которые находятся вне BMP, с помощью строк wchar _t *. Следующий тестовый код дал неожиданные результаты...
вопрос задан: 19 July 2012 18:58
0
ответов

Извлечение подстроки по позициям байтов utf-8

У меня есть строка, начало и длина, с которой извлекается подстрока. Обе позиции (начало и длина) основаны на смещениях байтов в исходной строке UTF8. Однако есть проблема: ...
вопрос задан: 26 June 2012 21:42
0
ответов

Кодировать/декодировать std::string в UTF-16

Мне нужно обработать формат файла (как для чтения, так и для записи), в котором строки кодируются в UTF-16 (2 байта на символ). Так как символы из таблицы ASCII редко используются в...
вопрос задан: 18 June 2012 22:24
0
ответов

Как я могу прочитать файл, закодированный в utf-16, в nodejs?

Мне нужно прочитать файл, закодированный в UTF-16, используя nodejs (порциями, потому что он очень большой). Данные из файла попадут в mongodb, поэтому мне нужно будет преобразовать их в utf-8. Погуглив, это...
вопрос задан: 7 June 2012 21:39
0
ответов

Правильное чтение текстового файла utf -16 в строку без внешних библиотек?

Я использую StackOverflow с самого начала, и иногда у меня возникало искушение публиковать вопросы, но я всегда либо разбирался в них сам, либо находил опубликованные ответы... до сих пор....
вопрос задан: 9 May 2012 20:39
0
ответов

Преобразование wchar_t* в строку UTF-16

Мне нужен код на C++ для преобразования строки, заданной в wchar_t*, в строку UTF-16. Он должен работать как в Windows, так и в Linux. Я просмотрел много веб-страниц во время поиска, но тема все еще ...
вопрос задан: 14 March 2012 06:54
0
ответов

Как уменьшить объем памяти в приложениях .NET, интенсивно использующих строки?

У меня есть приложение, в котором из соображений производительности хранится около 1 000 000 строк. Мое приложение потребляет ~ 200 МБ ОЗУ. Я хочу уменьшить объем памяти, потребляемой строками. Я знаю .NET...
вопрос задан: 10 March 2012 08:59
0
ответов

Как использовать Ruby для замены текста в файле ресурсов VC++, когда кодировка полностью удалена?

У меня есть простой управляемый проект VC++ в решении. У него есть файл ресурсов app.rc, который используется для хранения информации о сборке (версия, продукт, авторские права и т. д.). Если я открою файл в своем текстовом редакторе, он...
вопрос задан: 9 March 2012 16:53
0
ответов

iOS NSString в UTF16

У меня есть строка, которую я получил от Apache server over HTTP: - (void)connection:(NSURLConnection *)connection didReceiveData:(NSData *)data { responseString = [[NSString alloc] initWithData:...
вопрос задан: 8 March 2012 15:57
0
ответов

Намерен ли Консорциум Unicode, чтобы в UTF-16 заканчивались символы? [закрыто]

Текущая версия UTF-16 способна кодировать только 1 112 064 различных числа (кодовых точек); 0x0-0x10FFFF. Намерен ли консорциум Unicode, чтобы в UTF-16 заканчивались символы? т.е. сделать ...
вопрос задан: 21 February 2012 19:47
0
ответов

Читатель Python UTF-16 CSV

У меня есть CSV-файл UTF-16, который я должен прочитать. Модуль csv Python, похоже, не поддерживает UTF-16. Я использую Python 2.7.2. Файлы CSV, которые мне нужно проанализировать, имеют огромный размер и содержат несколько ГБ данных. ...
вопрос задан: 7 February 2012 17:05
0
ответов

Преобразование UTF-8 с спецификацией в UTF-8 без спецификации в Python

Здесь два вопроса. У меня есть набор файлов, которые обычно UTF-8 с спецификацией. Я хотел бы преобразовать их (в идеале на месте) в UTF-8 без спецификации. Похоже на codecs.StreamRecoder (stream, encode, decode, ...
вопрос задан: 30 January 2012 21:15
0
ответов

Почему примитив Java char занимает 2 байта памяти?

Есть ли причина, по которой примитивный тип данных Java char является 2 байта в отличие от C, который составляет 1 байт? Спасибо
вопрос задан: 23 December 2011 23:30
0
ответов

Как напечатать символы UTF-16 в C?

У меня есть файл, содержащий символы UTF-16. я читаю в файле и могу хранить символы либо в массиве uint16_t, либо в массиве char (любой лучший выбор?) Но как мне напечатать эти символы?
вопрос задан: 29 November 2011 18:20
0
ответов

Ад Unicode (в Windows) [закрыто]

Сегодня я проснулся и почувствовал что-то было ужасно неправильно с моим кодом и каждой библиотекой, которую я когда-либо использовал, и я думаю, что был прав ... (или, пожалуйста, укажите, где мои рассуждения неверны) Давайте начнем десятилетие ...
вопрос задан: 12 August 2011 15:26
0
ответов

Как получить надежное количество символов Юникода в Python?

Google App Engine использует Python 2.5.2, очевидно, с включенным UCS4. Но хранилище данных GAE внутренне использует UTF-8. Итак, если вы сохраняете u '\ ud834 \ udd0c' (длина 2) в хранилище данных, при его извлечении вы ...
вопрос задан: 3 August 2011 06:26
0
ответов

javascript dhe manipulimi i vargut w / utf-16 çifte zëvendësuese

I ' duke punuar në një aplikacion twitter dhe thjesht u futa në botën e utf-8 (16). Duket se shumica e funksioneve të vargjeve javascript janë po aq të verbër sa çiftet zëvendësuese si unë. Duhet të rikodifikoj disa gjëra ...
вопрос задан: 30 July 2011 21:51
0
ответов

java.nio.charset.MalformedInputException при чтении потока

Я использую следующий код для чтения данных. Он выдает исключение java.nio.charset.MalformedInputException. Файл, который я могу открыть в обычном режиме, но он содержит символы, отличные от ascii. В любом случае я могу исправить эту проблему? Источн
вопрос задан: 30 July 2011 19:14
0
ответов

поиск файла utf-16 в python. как?

По какой-то причине я не могу найти свой файл utf16. Он создает «UnicodeException: поток UTF-16 не начинается с спецификации». Мой код: f = codecs.open (ai_file, 'r', 'utf-16') seek = self.ai_map [self._cbClass ....
вопрос задан: 21 July 2011 16:17
0
ответов

Что мне нужно знать, чтобы мое приложение I18N работало на японском языке?

Я работаю над приложением I18N, которое будет расположено на японском языке, я не знаю ни слова на японском, и сначала мне интересно, достаточно ли для этого языка utf8. Обычно для европейского языка ...
вопрос задан: 1 June 2011 10:02
0
ответов

Какая кодировка символов лучше всего подходит для транснациональных компаний

Если бы у вас был веб-сайт, который нужно было перевести на все языки мира, и поэтому у вас была база данных со всеми этими переводами, что кодировка символов была бы лучше всего? UTF-128? Если да, то все…
вопрос задан: 20 April 2011 15:52
0
ответов

C: Самый эффективный способ определить, сколько байтов потребуется для строки UTF-16 из строки UTF-8

Я видел очень умный код для преобразования между кодовыми точками Unicode и UTF-8, поэтому мне было интересно, есть ли у кого-нибудь (или было бы интересно разрабатывать) это. Учитывая строку UTF-8, сколько байтов ...
вопрос задан: 20 April 2011 09:29
0
ответов

R write.csv с кодировкой UTF-16

У меня проблемы с выводом data.frame с помощью write.csv с кодировкой UTF-16 . Предыстория: я пытаюсь записать файл CSV из data.frame для использования в Excel. Excel Mac 2011 кажется ...
вопрос задан: 17 April 2011 08:08
0
ответов

UTF-16 decoder not working as expected

I have a part of my Unicode library that decodes UTF-16 into raw Unicode code points. However, it isn't working as expected. Here's the relevant part of the code (omitting UTF-8 and string ...
вопрос задан: 17 April 2011 08:08
0
ответов

What are the consequences of storing a C# string (UTF-16) in a SQL Server nvarchar (UCS-2) column?

It seems that SQL Server uses Unicode UCS-2, a 2-byte fixed-length character encoding, for nchar/nvarchar fields. Meanwhile, C# uses Unicode UTF-16 encoding for its strings (note: Some people don't ...
вопрос задан: 13 April 2011 09:54
0
ответов

Кодировка UTF-16 в Java по сравнению с C #

Я пытаюсь прочитать строку в схеме кодировки UTF-16 и выполнить для нее хеширование MD5. Но, как ни странно, Java и C # возвращают разные результаты, когда я пытаюсь это сделать. Ниже приведен фрагмент ...
вопрос задан: 7 April 2011 03:13
0
ответов

Общее количество символов UTF16

Можете ли вы вычислить, что кодировка UTF16 представляет 1,112,064 числа путем перестановок / комбинаций?
вопрос задан: 6 April 2011 13:36