У меня есть мобильное приложение, которое должно быть портировано для японской аудитории. Часть приложения является файлом пользовательского шрифта, который должен быть расширен только от содержания латинского 1 символа к также...
У меня есть строка, из которой я хочу извлечь 3 группы: '19 janvier 2012 '->' 19 ',' janvier ',' 2012 'Название месяца может содержать не Символы ASCII, поэтому [A-Za-z] у меня не работает: >>> ...
Я пытаюсь обработать регулярное выражение Java для разделения строк общего формата "нечто - панель" в "нечто" и "панель" с помощью Pattern.split (). "-" символ может быть одним из нескольких тире: ASCII '...
Как я могу обрезать строку (6) «страница», где первый пробел - это неразрывный пробел 0xc2a0? Я пробовал trim () и preg_match ('/ ^ \ s * (. *) \ S * $ / u', $ key, $ m) ;. Другой вопрос: как я могу надежно ...
Какие символы Юникода (точнее, кодовые точки) опасны и должны быть внесены в черный список и запрещены для использования пользователями?
Я знаю, что символы переопределения BIDI и "нулевая ширина" пробел "...
Я пытаюсь разработать, как иметь представление UNICODE Sun, 03 мая 2009 19:58:58 - 0700 как eee, dd MMM yyyy HH:mm:s ZZZZ или что-то. Я, может казаться, не получаю эту работу точно.
Суть моего вопроса такова: как я могу отображать символы Unicode в графическом интерфейсе пользователя Matlab (ОС X), чтобы они правильно отображались? Подробности: у меня есть таблица строк, хранящихся в файле, и некоторые из ...
Я должен преобразовать NSString в unicode к NSString в ASCII, изменяющем все локальные символы: Ą к A, Ś к S, Ó к O, ü Вам, И так далее... Что самый простой путь состоит в том, чтобы сделать это?
Я использую json с unicode текстом и имею проблему с собственной json реализацией IE8. <meta http-equiv = содержание "Типа контента" = "текст/HTML; charset=utf-8"/> <сценарий>...
У меня есть база данных SQL Server 2005, в которой есть таблицы, содержащие арабский текст. Тип данных для этих полей - NVARCHAR (n). Арабский текст внутри таблицы отображается правильно, и когда ...
Каковы более портативные и понятные способы обработки последовательностей символов Юникода в С и C ++? Более того, как: -Читать строки Юникода -Конвертировать строки Юникода в ASCII, чтобы сохранить несколько байтов (если ...
Я должен сохранить содержание сайта, который может быть на любом языке. И я должен смочь искать содержание строку Unicode. Я попробовал что-то как: urllib2 req импорта = urllib2....
Я использовал http://translate.google.com/#en|hi|Bangalore для получить хинди для Бангалора и बंगलौर. Но когда я вставил его в vim, перед последним персонажем произошел перерыв र. com / # en | hi | Бангалор, чтобы получить хинди для Бангалора и बंगलौर. Н
Существуют ли символы Юникода для представления связок (и частичных связок) из 5 в стиле счетного / пятизначного ворот? Если нет, какое было бы наиболее стандартное / семантическое / доступное решение для этого ...
Я пытаюсь разобрать заголовок со следующей веб-страницы: http://kid37.blogger.de/stories/1670573/ Когда я использую метод apache.commons.lang StringEscapeUtils.escapeHTML для элемента заголовка I получить ...
Я хотел бы записать сценарий Ruby, который пишет японские символы в консоль. Например: помещает "こんにちは・今日は" Однако, я получаю исключение при выполнении его: засада rb:1: Недопустимый символ '\377' в...
Используя SQLite3 в Python, я пытаюсь сохранить сжатую версию отрывка HTML-кода UTF-8. Код похож на это:... c = connection.cursor () c.execute ('создают вздор таблицы (cid целое число...
Я пытаюсь переместиться в Python 2.7 и так как Unicode является Грандиозное предприятие там, я попытался бы иметь дело с ними с XML-файлами и текстами и проанализировал бы их пользующийся xml.etree.cElementTree библиотекой. Но я натыкался...
Я задаюсь вопросом, почему это. У меня есть два unicode символа от той же группы Ll, который разрешен согласно спецификациям: http://msdn.microsoft.com/en-us/library/aa664670%28VS.71%29.aspx Один из них...
MsWord использует символы Wingdings и Symbol для маркеров, по умолчанию их шестнадцатеричные значения являются F0A7 и F0B7. Я хочу преобразовать маркеры в их эквиваленты Unicode. Конечно, это зависит от...
Я постоянно получаю эту ошибку с помощью акулы-мако: UnicodeEncodeError: кодек 'ASCII' не может закодировать символьный u '\xe0' в положении 6: порядковый не в диапазоне (128) я сказал акуле-мако, что использую unicode в любом возможном way:...
У меня есть webview, и пытаюсь загрузить простой текст UTF-8 в него. mWebView.loadData (" 將賦予他們的傳教工作標示為 ", "текст/HTML", "UTF-8"); Но веб-представление отображает мусор ANSI/ASCII. Очевидно, проблема кодирования...
У меня есть проблемы с символами неASCII и DictWriter. Короткая версия моей проблемы: #!/usr/bin/env Python #-*-кодирование: utf-8-*-кодеки импорта импортируют csv f = codecs.open ("test.csv", '...
У меня есть скребок, который собирает некоторые данные откуда-либо, что я не имею никакого контроля. Исходные данные делают все виды интересных символов Unicode, но это преобразовывает их в довольно бесполезное...
Я возвращаю из библиотеки, что надеется быть неправильной строкой unicode:>>> заголовок u'Sopet\xc3\xb3n' Теперь, те два шестнадцатеричных Escape там являются кодировкой UTF-8 для МАЛЕНЬКОЙ ЛАТЫНИ U+00F3...
Мой код - в основном это: wstring Япония = L" 日本 "; сообщение wstring = L "Добро пожаловать! Япония"; обменивайтесь сообщениями + = Япония; wprintf (сообщение c_str ()); я желаю использовать широкие строки, но я не знаю, как они...