Я пытаюсь соответствовать unicode символам в Java. Входная строка: Строка informa для соответствия: informátion До сих пор я попробовал это: Шаблон p = Pattern.compile ("informa[\u0000-\uffff].*", (Шаблон....
(редактирующий для разъяснения и добавляющий некоторый код), Привет у Нас есть требование для парсинга данных, отправленных от пользователей во всем мире. Наши системы Linux имеют локаль по умолчанию en_US.UTF-8. Однако мы...
Как я должен изменить следующий Vb. Сетевой код для записи ул. в файл в unicode? Я должен преобразовать ул. в Unicode прежде, чем записать в файл? Используя коротковолновый Как StreamWriter = Новый StreamWriter (fname)...
У меня есть название улицы как KRZYWOŃ ANIELI и поэтому каков должен быть мой regex для разрешения этого вида выражения. В настоящее время у меня есть простой, который использует/^ [a-zA-Z] +, $ / Любезно советуют.
Я испытываю затруднения при хранении и выводе ndash символа как UTF-8 в Django. Я получаю данные из API. В необработанной форме, как получено и просматривается в текстовом редакторе, учитывая единицу информации может быть подобным...
Я добираюсь от серверных данных с помощью сигнала и слота. Вот часть слота: текст QString (это-> ответ-> readAll ()); проблема, который в текстовой переменной будет Escape unicode, например: \u043d\u0435 \...
Насколько я знаю, что Linux выбрал обратную совместимость UTF-8, тогда как Windows добавил абсолютно новые API-функции для UTF-16 (заканчивающийся "W"). Эти решения могли отличаться? Какой доказанный...
Я просто наследовал проект, который имеет код, подобный следующему (довольно простому) примеру: ОБЪЯВИТЕ @Demo ТАБЛИЦУ (Количество INT, Символ NVARCHAR (10)) INSERT INTO @Demo (Количество, Символ)...
Я работал над Euler 40 Проекта и был немного побеспокоен, что не было никакого международного Синтаксического анализа (символ). Не грандиозное предприятие, но я сделал некоторых расспрашивать тут и там, и кто-то предложил символ. GetNumericValue. GetNumer
Это перестало работать с этим, когда я выполняю затмение или когда я запускаю свой скрипт в iPython: кодек 'ASCII' не может декодировать байт 0xe2 в положении 32: порядковый не в диапазоне (128) я не знаю почему, но когда я просто...
:) Я пытался использовать w = Word (распечатки), но он не работает. Как я должен дать спецификацию для этого. 'w' предназначен для обработки символов хинди (UTF-8), код указывает грамматику и синтаксические анализы...
Я пытаюсь изучить Python и не мог выяснить, как перевести следующий сценарий жемчуга в Python: #!/usr/bin/perl-w используют открытый QW (: станд.: utf8); в то время как (<>) {s/\x {...
У меня есть эти строки в Vim: c b e é f g и когда я делаю: %sort, я получаю это: b c e f g é, Очевидно, "é" строка не должна быть в конце, это должно быть после "e" строки. Действительно ли возможно добраться...
Единственная разница - то, что Winmain берет символ* для lpCmdLine параметра, в то время как wWinMain берет wchar_t*. На Windows XP, если записью приложения является WinMain, делает Windows, преобразовывают командную строку из...
Я выполняю форум, разработанный для поддержки международной группы математики. Я недавно переключил его на unicode для лучшей поддержки международных символов. В отладке этого преобразования я имею...
Как делают меня для преобразования различных символов Unicode в их самые близкие эквиваленты ASCII? Как Ä-> A. Я погуглил, но не нашел подходящего решения. Кодирование приема. ASCII.GetBytes ("Ä") [0] не работал....
Мы позволяем пользователям искать базу данных от единственного ввода текста, и я испытываю затруднения в фильтрации некоторых пользовательских предоставленных строк. Например, если пользователь отправляет: жидкокристаллический SONY ��������� (Отмечают?'..
Существует ли функция php для обработки кодировки ниже? .replaceAll (" \u00c3\u0080", "À";) .replaceAll (" \u00c3\u0081", "Á";) .replaceAll (" \u00c3\u0082", "Â";)...
Я пытаюсь назвать time.strftime Python () функцией с помощью строки формата Unicode: u' %d\u200f / % m\u200f / % Y %H: % M: S % (\u200f "Справа налево Mark" (RLM).) Однако я получаю исключение...
Когда я храню NSString в некотором NSDictionary и журнале что словарь к консоли как это: NSString *someString = "Мюнстер"; NSDictionary *someDict = [NSDictionary...
У меня есть список файлов, которые я пытаюсь скопировать и переместить (использование CP и mv) в сценарии оболочки удара. Проблема, с которой я сталкиваюсь, состоит в том, что я не могу заставить ни одну команду распознавать огромное количество...
У меня есть база данных в MSSQL, который я портирую на SQLite/Django. Я использую pymssql, чтобы соединиться с базой данных и сохранить текстовое поле к локальной базе данных SQLite. Однако для некоторых символов, этого...
На основе ссылки ниже я смущен относительно того, поддерживает ли язык программирования Lua Unicode. http://lua-users.org/wiki/LuaUnicode кажется, что это делает, но имеет ограничения. Я просто не делаю...
У меня есть это предупреждение каждый раз, когда я выполняю свой сценарий CGI (вывод представляется Шаблоном:: Инструментарий): Широкий символ в печати в/usr/local/lib/perl5/site_perl/5.8.9/mach/Template.pm строке 163. Что...
При запущении программы Python, которая читает из stdin, я получаю следующую ошибку: UnicodeDecodeError: кодек 'ASCII' не может декодировать байт 0xc3 в положении 320: порядковый не в диапазоне (128), Как я могу зафиксировать его?...
Когда я пытаюсь добавить файл с российскими символами на имя к образцовому экземпляру через метод экземпляра file_field.save по умолчанию, я получаю UnicodeDecodeError (ошибка декодирования ASCII, не в диапазоне (128)...
Я пытаюсь достигнуть диакритического знака и нечувствительной к регистру сортировки в MySQL. Следуя инструкциям в руководстве, это, как предполагается, работает с utf8 набором символов и utf8_general_ci сопоставлением...
Путем обращения Статьи Joel Некоторые люди являются объектом неправильного представления, что Unicode является просто 16-битным кодом, где каждый символ берет 16 битов и поэтому существует 65 536 возможных...
Если у меня есть массив байтов, который содержит содержание UTF8, как я пошел бы о парсинге его? Есть ли байты разделителя, которые я могу отделить для получения каждого символа?