Я пишу сценарий, который попытается кодировать байты во многую различную кодировку в Python 2.6. Там некоторый путь состоит в том, чтобы получить список доступной кодировки, которой я могу выполнить итерации? Причина я пробую...
Учитывая массив байтов, который является или UTF-8 закодированная строка или произвольными двоичными данными, что подходы могут использоваться в Java для определения, который это? Массив может быть сгенерирован кодом, подобным: байт []...
Есть ли любой lib, который может заменить специальные символы к эквивалентам ASCII, как: "Cześć" к: "Czesc" я могу, конечно, создать карту: {'ś ':', 'ć ': 'c'} и использование некоторая функция замены. Но я не делаю...
Я работаю над веб-приложением, где я передаю данные от сервера до браузера в XML. Так как я датчанин, я быстро сталкиваюсь с проблемами с символами æøå. Я знаю, что в HTML, использую "...
Я создал небольшую программу для отображения символа регионального языка, но вывод, который я получил в командной строке, - «?» только для всех юникодов выше U + 0080, включая U + 0080 (за исключением английского алфавита ...
Я знаю о ICU, и небольшие библиотеки как utf8 один на проекте кода (забудьте точное имя), однако, ни один из них не точно, что я хочу. То, что я действительно хочу, является чем-то как ICU, но обернутый...
Я никогда не был уверен, что понимаю, что различие между str/unicode декодирует и кодирует. Я знаю, что ул. () .decode () для того, когда у Вас есть строка байтов, которые Вы знаете, имеет определенный символ...
Вот веб-сайт, я нашел, что это произведет перевернутые версии любого английского текста.как это работает? unicode имеет перевернутые символы? Или что? Как я могу записать свой собственный текст, зеркально отражающий функцию?
Я ищу способ соответствовать только полностью составленным символам в строке Unicode. [:печать:] зависящий от локали в какой-либо реализации регулярного выражения, которая включает этот класс символов?...
У кого-либо есть какой-либо код для расположения в алфавитном порядке арабского и японского текста, который находится в Unicode? Если бы код был в рубине, который был бы большим.
Unicode имеет миллион подобных значку глифов, но их не всегда легко искать, так как я не всегда знаю то, на что они похожи. Существует ли глиф Unicode, который похож на "ключ"? Или есть ли...
Я нашел это в статье Википедии о utf-8: Сортировка строк UTF-8 как массивы неподписанных байтов приведет к тем же результатам как сортировка их на основе кодовых точек Unicode. Это привело бы меня...
Я разрабатываю новый CMS, но хочу разработать его для установки всем моим будущим потребностям как Многоязычное содержание, таким образом, я думал, что Unicode (UTF-8) является лучшим решением, Но с некоторым поиском я получил эту статью...
Мы обновляем наш проект от Delphi 2006 к Delphi 2010. Старый код был: InputText: строка; InputText: = SomeTEditComponent. Текст;..., поскольку я: = 1 к длине (InputText) делают если InputText [я] в ['0'.. '9'...
Рассмотрите эту программу: #include <stdio.h> международное основное () {printf (" %s\n", __ ФАЙЛ __); возвратитесь 0;} В зависимости от названия файла, эта программа работы - или нет. Проблема, с которой я сталкиваюсь...
У меня есть строка Unicode Python. Я хочу удостовериться, что это только содержит буквы от Романского алфавита (Через Z), а также обычно обозначает буквами находимый в европейских алфавитах, таких как ß, ü, ø, é, à, и...
Предположим, что у меня есть содержание UTF-8, сохраненное в памяти, как я читаю символы с помощью указателя? Я предполагаю, что должен наблюдать за 8-м битом, указывающим на многобайтовый символ, но как точно делают я поворачиваюсь...
Я обращаюсь к замене из большого документа все высокие unicode символы, такие как акцентируемый Es, левые и правые кавычки, и т.д., с "нормальными" дубликатами в низком диапазоне, такими как обычный 'E', и...
У меня есть проблема при отображении строки JavaScript со встроенными управляющими последовательностями символов Unicode (\uXXXX), где начальной буквы "\" символ самостоятельно оставляют как "\"; К чему я должен сделать...
Что лучше для разработчиков PHP - Unicode или UTF-8? Я собираюсь создать международный CMS. Таким образом, я собираюсь иметь клиенты во всем мире. Они будут говорить на всех возможных языках. Что...
Я пытаюсь выполнить subprocess.call () с unicode именем файла и сюда являюсь упрощенной проблемой: n = u'c:\\windows\\notepad.exe 'f = u'c:\\temp\\nèw.txt' subprocess.call (n + f), который повышает известный error:...
Символ Java составляет 2 байта (макс. размер 65 536), но существует 95 221 символ Unicode. Это означает, что Вы не можете обработать определенные символы Unicode в JAVA-приложении? Недооценивает это кипение к...
Каково различие между наборами символов и кодировкой символов? Когда я говорю, что использую utf-8, кодирующий затем, каков будет мой набор символов? Это берет unicode в качестве набора символов по умолчанию?
Я работаю над Встроенным микропрограммным обеспечением для встроенного проекта USB. Производственный программист, которого я хотел бы использовать автоматически, пишет Порядковый номер во флэш-память устройства в указанной памяти...
Используя Java 6 для получения 8-разрядных символов от Строки: System.out.println (Arrays.toString ("öä".getBytes ("ISO-8859-1"))); дает мне, на Linux: [-10, 28], но OS X я добираюсь: [63, 63, 63,-89] я кажусь, добираются...
полностью перепутанный к настоящему времени... Я разрабатываю в python/django и использую вход Python. Все мое приложение требует unicode, и все мои модели имеют только unicode ()', возвращаются u'..' методы реализованы. Теперь...
Я вижу, что Visual Studio 2008 и позже теперь начинается новое решение с набором Набора символов к Unicode. Мой старый код C++ имеет дело только с английским текстом ASCII и полон: Литеральные строки как "...