2
ответа

Как я соответствую unicode символам в Java

Я пытаюсь соответствовать unicode символам в Java. Входная строка: Строка informa для соответствия: informátion До сих пор я попробовал это: Шаблон p = Pattern.compile ("informa[\u0000-\uffff].*", (Шаблон....
вопрос задан: 23 June 2010 16:07
2
ответа

Как я могу открыть файлы, содержащие диакритические знаки в Java?

(редактирующий для разъяснения и добавляющий некоторый код), Привет у Нас есть требование для парсинга данных, отправленных от пользователей во всем мире. Наши системы Linux имеют локаль по умолчанию en_US.UTF-8. Однако мы...
вопрос задан: 21 June 2010 12:20
2
ответа

Как записать в файл в Unicode в Vb. Сеть

Как я должен изменить следующий Vb. Сетевой код для записи ул. в файл в unicode? Я должен преобразовать ул. в Unicode прежде, чем записать в файл? Используя коротковолновый Как StreamWriter = Новый StreamWriter (fname)...
вопрос задан: 11 June 2010 09:32
2
ответа

Как иметь дело с польскими Символами при использовании regex?

У меня есть название улицы как KRZYWOŃ ANIELI и поэтому каков должен быть мой regex для разрешения этого вида выражения. В настоящее время у меня есть простой, который использует/^ [a-zA-Z] +, $ / Любезно советуют.
вопрос задан: 10 June 2010 19:01
2
ответа

Удваивает Django, кодирующего Unicode (utf-8?) строка?

Я испытываю затруднения при хранении и выводе ndash символа как UTF-8 в Django. Я получаю данные из API. В необработанной форме, как получено и просматривается в текстовом редакторе, учитывая единицу информации может быть подобным...
вопрос задан: 4 June 2010 07:21
2
ответа

QT и unicode выходят из строки

Я добираюсь от серверных данных с помощью сигнала и слота. Вот часть слота: текст QString (это-> ответ-> readAll ()); проблема, который в текстовой переменной будет Escape unicode, например: \u043d\u0435 \...
вопрос задан: 2 June 2010 18:38
2
ответа

Почему создатели систем Windows и Linux выбрали различные способы поддерживать Unicode?

Насколько я знаю, что Linux выбрал обратную совместимость UTF-8, тогда как Windows добавил абсолютно новые API-функции для UTF-16 (заканчивающийся "W"). Эти решения могли отличаться? Какой доказанный...
вопрос задан: 28 May 2010 11:12
2
ответа

TSQL, снабжающий префиксом строковый литерал на вставке - какое-либо значение к этому, или избыточный?

Я просто наследовал проект, который имеет код, подобный следующему (довольно простому) примеру: ОБЪЯВИТЕ @Demo ТАБЛИЦУ (Количество INT, Символ NVARCHAR (10)) INSERT INTO @Demo (Количество, Символ)...
вопрос задан: 27 May 2010 20:38
2
ответа

Каково соглашение с символом. GetNumericValue?

Я работал над Euler 40 Проекта и был немного побеспокоен, что не было никакого международного Синтаксического анализа (символ). Не грандиозное предприятие, но я сделал некоторых расспрашивать тут и там, и кто-то предложил символ. GetNumericValue. GetNumer
вопрос задан: 19 May 2010 15:05
2
ответа

сбои feedparser во время запущенного скрипта, но не могут воспроизвести в интерактивной консоли Python

Это перестало работать с этим, когда я выполняю затмение или когда я запускаю свой скрипт в iPython: кодек 'ASCII' не может декодировать байт 0xe2 в положении 32: порядковый не в диапазоне (128) я не знаю почему, но когда я просто...
вопрос задан: 18 May 2010 16:53
2
ответа

Python - pyparsing unicode символы

:) Я пытался использовать w = Word (распечатки), но он не работает. Как я должен дать спецификацию для этого. 'w' предназначен для обработки символов хинди (UTF-8), код указывает грамматику и синтаксические анализы...
вопрос задан: 27 April 2010 22:17
2
ответа

Как заменить unicode символы символами ASCII в Python (данный сценарий жемчуга)?

Я пытаюсь изучить Python и не мог выяснить, как перевести следующий сценарий жемчуга в Python: #!/usr/bin/perl-w используют открытый QW (: станд.: utf8); в то время как (<>) {s/\x {...
вопрос задан: 23 April 2010 18:01
2
ответа

Как отсортировать строки UTF-8 в Vim?

У меня есть эти строки в Vim: c b e é f g и когда я делаю: %sort, я получаю это: b c e f g é, Очевидно, "é" строка не должна быть в конце, это должно быть после "e" строки. Действительно ли возможно добраться...
вопрос задан: 21 April 2010 13:11
2
ответа

Различие между WinMain и wWinMain

Единственная разница - то, что Winmain берет символ* для lpCmdLine параметра, в то время как wWinMain берет wchar_t*. На Windows XP, если записью приложения является WinMain, делает Windows, преобразовывают командную строку из...
вопрос задан: 18 April 2010 22:20
2
ответа

Как я лучше всего удаляю unicode символы, которые XHTML рассматривает как недопустимое использование php?

Я выполняю форум, разработанный для поддержки международной группы математики. Я недавно переключил его на unicode для лучшей поддержки международных символов. В отладке этого преобразования я имею...
вопрос задан: 13 April 2010 07:43
2
ответа

Преобразуйте символ Unicode в самый близкий (самый подобный) символ в ASCII (.NET)

Как делают меня для преобразования различных символов Unicode в их самые близкие эквиваленты ASCII? Как Ä-> A. Я погуглил, но не нашел подходящего решения. Кодирование приема. ASCII.GetBytes ("Ä") [0] не работал....
вопрос задан: 12 April 2010 22:43
2
ответа

Проверка ввода данных пользователем или ���������

Мы позволяем пользователям искать базу данных от единственного ввода текста, и я испытываю затруднения в фильтрации некоторых пользовательских предоставленных строк. Например, если пользователь отправляет: жидкокристаллический SONY ��������� (Отмечают?'..
вопрос задан: 12 April 2010 15:46
2
ответа

Python utf-8, практическое руководство выравнивает распечатку

У меня есть массив, содержащий японские символы, а также "нормальный". Как я выравниваю распечатку их? #!/usr/bin/python # coding=utf-8 a1 = [' する ', ' します ', 'trazan'', した ', ' しました '] a2 = ['dipsy', 'laa-...
вопрос задан: 5 April 2010 11:19
2
ответа

PHP функционируют для преобразования unicode в специальные символы?

Существует ли функция php для обработки кодировки ниже? .replaceAll (" \u00c3\u0080", "&Agrave";) .replaceAll (" \u00c3\u0081", "&Aacute";) .replaceAll (" \u00c3\u0082", "&Acirc";)...
вопрос задан: 5 April 2010 10:28
2
ответа

Используя формат Unicode для Python 'time.strftime ()'

Я пытаюсь назвать time.strftime Python () функцией с помощью строки формата Unicode: u' %d\u200f / % m\u200f / % Y %H: % M: S % (\u200f "Справа налево Mark" (RLM).) Однако я получаю исключение...
вопрос задан: 3 April 2010 14:35
2
ответа

Как я могу выйти из unicode символов в NSString?

Когда я храню NSString в некотором NSDictionary и журнале что словарь к консоли как это: NSString *someString = "Мюнстер"; NSDictionary *someDict = [NSDictionary...
вопрос задан: 31 March 2010 18:52
2
ответа

Как я могу скопировать файлы с именами, содержащими пробелы и UNICODE при использовании сценария оболочки?

У меня есть список файлов, которые я пытаюсь скопировать и переместить (использование CP и mv) в сценарии оболочки удара. Проблема, с которой я сталкиваюсь, состоит в том, что я не могу заставить ни одну команду распознавать огромное количество...
вопрос задан: 31 March 2010 06:19
2
ответа

Преобразуйте или разделите “недопустимые” символы Unicode

У меня есть база данных в MSSQL, который я портирую на SQLite/Django. Я использую pymssql, чтобы соединиться с базой данных и сохранить текстовое поле к локальной базе данных SQLite. Однако для некоторых символов, этого...
вопрос задан: 24 March 2010 15:14
2
ответа

Lua поддерживает Unicode?

На основе ссылки ниже я смущен относительно того, поддерживает ли язык программирования Lua Unicode. http://lua-users.org/wiki/LuaUnicode кажется, что это делает, но имеет ограничения. Я просто не делаю...
вопрос задан: 23 March 2010 05:37
2
ответа

Как я устраняю “Широкий символ TT в печати” предупреждение?

У меня есть это предупреждение каждый раз, когда я выполняю свой сценарий CGI (вывод представляется Шаблоном:: Инструментарий): Широкий символ в печати в/usr/local/lib/perl5/site_perl/5.8.9/mach/Template.pm строке 163. Что...
вопрос задан: 18 March 2010 09:09
2
ответа

Python: UnicodeEncodeError при чтении из stdin

При запущении программы Python, которая читает из stdin, я получаю следующую ошибку: UnicodeDecodeError: кодек 'ASCII' не может декодировать байт 0xc3 в положении 320: порядковый не в диапазоне (128), Как я могу зафиксировать его?...
вопрос задан: 18 March 2010 06:55
2
ответа

UnicodeDecodeError на попытке сохранить файл через django значение по умолчанию filebased бэкенд

Когда я пытаюсь добавить файл с российскими символами на имя к образцовому экземпляру через метод экземпляра file_field.save по умолчанию, я получаю UnicodeDecodeError (ошибка декодирования ASCII, не в диапазоне (128)...
вопрос задан: 17 March 2010 06:49
2
ответа

Не чувствительная к диакритическим знакам сортировка в MySQL

Я пытаюсь достигнуть диакритического знака и нечувствительной к регистру сортировки в MySQL. Следуя инструкциям в руководстве, это, как предполагается, работает с utf8 набором символов и utf8_general_ci сопоставлением...
вопрос задан: 5 March 2010 18:17
2
ответа

Беспорядок на Unicode и многобайтовых статьях

Путем обращения Статьи Joel Некоторые люди являются объектом неправильного представления, что Unicode является просто 16-битным кодом, где каждый символ берет 16 битов и поэтому существует 65 536 возможных...
вопрос задан: 5 March 2010 02:27
2
ответа

Есть ли байты разделителя для символов UTF8?

Если у меня есть массив байтов, который содержит содержание UTF8, как я пошел бы о парсинге его? Есть ли байты разделителя, которые я могу отделить для получения каждого символа?
вопрос задан: 23 February 2010 22:56