2
ответа

unicode () по сравнению с str.decode () для utf8 закодировал строку байтов (Python 2.x)

Там какая-либо причина состоит в том, чтобы предпочесть unicode (somestring, 'utf8') в противоположность somestring.decode ('utf8')? Моя единственная мысль - то, что .decode () является связанным методом, таким образом, Python может разрешать его больше..
вопрос задан: 4 April 2012 14:07
2
ответа

Блок Unicode символа в Python

Существует ли способ получить Блок Unicode символа в Python? unicodedata модуль, кажется, не имеет то, в чем я нуждаюсь, и я не мог найти внешнюю библиотеку для него. В основном мне нужно то же...
вопрос задан: 29 March 2012 18:47
2
ответа

Как соответствовать символам кириллицы регулярному выражению

Как я соответствую французским и российским символам Кириллического алфавита регулярному выражению? Я только хочу сделать альфа-символы, никакие числа или специальные символы. Прямо сейчас я имею [A-Za-z]
вопрос задан: 29 March 2012 18:42
2
ответа

Как декодировать экранированные символы Unicode (\ u30c1 - & gt; チ)? [Дубликат]

Я очищаю веб-сайты и мне нужно декодировать escape-последовательности javascript для стандартных строк unicode. Например, исходный файл содержит последовательность: \ u30ca \ u30c1 \ u30e5 \ u30e9 \ u30eb \ u30ed \ u30fc \ u30bd \ ...
вопрос задан: 15 March 2012 05:12
2
ответа

Каков внутренний формат Строки.NET?

Я делаю некоторый довольно интенсивный обработкой строк код в C#.NET и стал любопытным на предмет некоторых статей Joel Spolsky, которые я не забыл читать некоторое время назад: http://www.joelonsoftware.com/articles/...
вопрос задан: 14 March 2012 13:10
2
ответа

Выделение размера для массива символов Юникода [дубликат]

В зависимости от того, нужен ли нам массив символов ASCII или расширенный массив символов ASCII, мы обычно выделяем размер 128 или 256 для массива символов ASCII, который должен содержать все ASCII ...
вопрос задан: 2 March 2012 14:26
2
ответа

Откройте файл ANSI и Сохраните файл Unicode с помощью Delphi

По некоторым причинам в последнее время *.UDL файлы во многих моих клиентских системах больше не совместимы, поскольку они были когда-то сохранены как файлы ANSI, который больше не совместим с ожидаемым форматом файла UNICODE....
вопрос задан: 22 February 2012 13:21
2
ответа

Символы Unicode и Internet Explorer

Я просто создал сайт, который полагается на определенные символы Unicode как Ⓐ но почему InternetExplorer не показывает эти символы? Есть ли некоторый метатег, чтобы заставить браузер показывать его или...
вопрос задан: 17 September 2011 13:56
2
ответа

Я успешно назвал LsaEnumerateAccountRights advapi32 () от C#. Теперь, как я неупорядочиваю массив LSA_UNICODE_STRING, который он возвращает?

Это - указатель на массив структур LSA_UNICODE_STRING. Я нашел некоторый код, который делает инверсию, т.е. создает LSA_UNICODE_STRING из строки C#. Вы видите это в секции кода помощника...
вопрос задан: 30 May 2011 20:51
2
ответа

Delphi 2010 Широкие функции по сравнению со Строковыми функциями

Мы в настоящее время преобразовываем проект Delphi 2007 года в Delphi 2010. Мы уже использовали Unicode (через WideStrings и Средства управления Unicode TNT). Я ожидал заменять все Широкие функции, например.
вопрос задан: 25 April 2011 02:24
2
ответа

Чтение unicode символы от текстового файла в Delphi 2009

У меня есть следующая часть кода, чтобы считать японские символы Kanji из Текстового файла формата UTF-8 и затем загрузить его в Заметку. Var F:textFile; S:string; Начните AssignFile (F, 'file.txt'); Сброс (F);...
вопрос задан: 23 April 2011 00:45
2
ответа

Естественный алгоритм сортировки в PHP с поддержкой Unicode?

Действительно ли возможно отсортировать массив с символами Unicode / UTF-8 в PHP использование алгоритма естественного порядка? Например (порядок в этом массиве правильно заказан): $array = массив (0 => 'Гибкий'...
вопрос задан: 19 April 2011 09:08
2
ответа

Обработка суррогата Unicode оценивает в строках Java

Рассмотрите следующий код: байт aBytes [] = {(байт) 0xff, 0x01,0,0, (байт) 0xd9, (байт) 0x65, (байт) 0x03, (байт) 0x04, (байт) 0x05, (байт) 0x06, (байт) 0x07...
вопрос задан: 6 April 2011 13:57
2
ответа

Android: добавьте несколько китайских символов [дубликат]

У меня есть несколько китайских иероглифов, которые по умолчанию доступны только на уровне API 23 и выше (они, я думаю, являются частью более новой версии Unicode). Я могу добавить шрифт, который я загрузил (NotoSansCJKsc-Regular ....
вопрос задан: 27 March 2011 14:35
2
ответа

Преобразование строк как \\uXXXX в Python

У меня есть строка как \uXXXX (представление), и я должен преобразовать его в unicode. Я получаю его от стороннего сервиса, таким образом, интерпретатор Python не преобразовывает его, и мне нужно преобразование в моем коде. Как...
вопрос задан: 23 October 2010 20:46
2
ответа

Как я нахожу длину строки Unicode в Perl?

perldoc страница для длины () говорит мне, что я должен использовать байты:: длина (EXPR) для нахождения строки Unicode в байтах, или и страница байтов повторяет это. используйте байты; $ascii = 'печаль Lorem ipsum находятся сережка'; $...
вопрос задан: 19 September 2010 16:56
2
ответа

Emacs, unicode, escape-последовательности мыши xterm и широкие терминалы

Краткая версия: При использовании режима xterm-mouse-mode emacs, Somebody (emacs? Bash? Xterm?) Перехватывает управляющие последовательности xterm и заменяет их на \ 0. Это неприятно для широких мониторов, потому что только первая ...
вопрос задан: 26 August 2010 15:08
2
ответа

Как сопоставить слова юникода с ruby ​​1.9?

Я использую ruby ​​1.9 и пытаюсь выяснить, какое регулярное выражение мне нужно, чтобы это стало правдой: Encoding.default_internal = Encoding.default_external = 'utf-8' "föö" .match (/ (\ w +) / u) [1] == "föö" # => false
вопрос задан: 26 August 2010 14:50
2
ответа

Некоторые символы utf8 разрешены в источнике Python, некоторые нет

Я заметил, что я не могу использовать все Unicode символы в моем исходном коде Python. Хотя def 价 (何): совершенно нормально (хотя и бессмысленно [вероятно?]), Def N (N₀, t, λ) -> 'N (t)': это не ...
вопрос задан: 18 August 2010 11:35
2
ответа

C++ win32 fstream широкий спор

См. ссылку для того, о чем я говорю. Я хочу использовать точку 1 в ссылке и #define tfopen _wfopen #define _T (s) L##s, чтобы сделать точно, что говорит ссылка, возможно: станд.:: файл ifstream (tfopen ("...
вопрос задан: 12 August 2010 19:22
2
ответа

Найдите подобный символ ASCII в Unicode

Делает кто-то знает простой способ найти символы в Unicode, которые подобны символам ASCII. Примером является "КИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА DZE (ѕ)". Я хотел бы сделать поиск и замену для подобного...
вопрос задан: 4 August 2010 09:29
2
ответа

Как обработать undecodable имена файлов в Python?

Я действительно хотел бы иметь свое соглашение о приложении Python исключительно со строками Unicode внутренне. Это шло хорошо у меня в последнее время, но я столкнулся с проблемой с обработкой путей. API POSIX...
вопрос задан: 4 August 2010 09:05
2
ответа

Unicode не преобразовал при отображении

Я локализую приложение испанскому языку, и символы кодируются в файле Localizable.strings для того языка с помощью Unicode. Например, у меня есть запись: "login.saveSettings" = "Guardar configuraci \\...
вопрос задан: 28 July 2010 12:25
2
ответа

Различие между MBCS и UTF-8 в Windows

Я читаю о символьном наборе и кодировке в Windows. Я заметил, что существует два флага компилятора в компиляторе Visual Studio (для C++) названы MBCS и UNICODE. Между чем различие...
вопрос задан: 21 July 2010 11:11
2
ответа

Что является Linux, эквивалентным из: MultiByteToWideChar & WideCharToMultiByte?

Я работаю с классом, который переносит станд.:: wstring, этот код должен быть кросс-платформенным, являются там эквивалентами функциям окон: MultiByteToWideChar & WideCharToMultiByte на Linux?...
вопрос задан: 18 July 2010 19:56
2
ответа

Отображение Unicode в Java JTextArea

Я пытаюсь распечатать unicode в JTextArea. Я заставил это печатать прекрасный к консоли, но когда я пытаюсь распечатать его к текстовой области, я получаю поля для всех двух байтов unicode символы. Любой...
вопрос задан: 16 July 2010 14:41
2
ответа

Python regex \w не соответствует объединяющимся диакритическим знакам?

У меня есть строка UTF8 с объединяющимися диакритическими знаками. Я хочу соответствовать ему \w regex последовательность. Это соответствует символам, которые имеют диакритические знаки, но не, если существует латинский символ с объединяющимися диакритиче
вопрос задан: 29 June 2010 13:25
2
ответа

Как произвести строки Unicode в Windows Console

уже существует несколько вопросов, касающихся этой проблемы. Я думаю, что мой вопрос несколько отличается, потому что у меня нет фактической проблемы, только спрашиваю я из академического интереса. Я знаю что Windows...
вопрос задан: 28 June 2010 08:49
2
ответа

Символ зеркала Unicode?

‮? retcarahc "rorrim" edocinu eht htiw detaicossa ytilibarenluv fo tros эмо ereht СИ? ksir yna ereht эра? rof ti СИ tahW
вопрос задан: 25 June 2010 02:36
2
ответа

Странное различие в Сопоставлении SQL Server 2005 года между varchar () и nvarchar ()

Может кто-то объяснять это: ЕЩЕ ВЫБЕРИТЕ СЛУЧАЙ, КОГДА БРОШЕНО ('iX' AS nvarchar (20))> БРОСОК ('-X' AS nvarchar (20)) ЗАТЕМ 1 0 КОНЦОВ, СЛУЧАЙ, КОГДА БРОШЕНО ('iX' AS varchar (20))> БРОСОК ('-X'...
вопрос задан: 23 June 2010 20:38