4
ответа

Unicode, utf-8/utf-16 кодирующий в Python

В Python: u '\u3053\n' Является этим utf-16? Я действительно не знаю обо всем материале unicode/encoding, но этот тип вещи подходит в моем наборе данных, как то, если у меня есть a=u '\u3053\n'. печать дает...
вопрос задан: 22 June 2010 17:00
4
ответа

Что делает unicode символ 
 представить?

unicode является 
 и это используется в XML-документе.
вопрос задан: 11 June 2010 18:26
4
ответа

Как использовать Unicode в C++?

Принятие очень простой программы, что: спросите имя. сохраните имя в переменной. отобразите переменное содержание на экране. Это настолько просто, который первая вещь, которую каждый изучает. Но моя проблема...
вопрос задан: 10 June 2010 01:05
4
ответа

Какую кодировку символов я должен использовать для веб-страницы, содержащей главным образом арабский текст? utf-8 хорошо?

Какую кодировку символов я должен использовать для веб-страницы, содержащей главным образом арабский текст? utf-8 хорошо?
вопрос задан: 8 June 2010 10:23
4
ответа

Фильтрация недопустимых символов XML в Java

Спецификация XML определяет подмножество символов Unicode, которые позволяются в XML-документах: http://www.w3.org/TR/REC-xml/#charsets. Как я отфильтровываю эти символы от Строки в Java? простой тест...
вопрос задан: 24 May 2010 12:54
4
ответа

исключения с Python unicode кодируют/декодируют функции (почему не делает errors=ignore, на самом деле игнорируют их??)

Кто-либо знает, почему функции преобразования строк выдают исключения, когда ошибки = "игнорируют", передается? То, как я могу преобразовать из обычной строки Python, возражает против unicode без бросаемых ошибок?...
вопрос задан: 21 April 2010 02:49
4
ответа

PHP: Преобразуйте вывод curl_exec в UTF8

Я хотел бы только работать с UTF8. Проблема, я не знаю набора символов каждой веб-страницы. Как я могу обнаружить его и преобразовать в UTF8? <? $url php = "http://vkontakte.ru"; $ch = curl_init ($url); $...
вопрос задан: 28 March 2010 01:39
4
ответа

Python: Как я могу заменить полноширинные символы полуширинными символами?

Если бы это было PHP, то я, вероятно, сделал бы что-то вроде этого: функционируйте no_more_half_widths ($string) {$foo = массив ('1', '2', '3', '4', '5', '6', '7', '8', '9', '10') $bar = массив ('1', '2', '3', '4', '5', '6', '7', '8'...
вопрос задан: 11 March 2010 02:43
4
ответа

Ошибка о недопустимых символах XML на Java

При парсинге XML-файла на Java я получаю ошибку: недопустимый символ XML (Unicode: 0x0), был найден в содержании элемента документа. xml прибывает из веб-сервиса. Проблема состоит в том, что я добираюсь...
вопрос задан: 2 March 2010 10:06
4
ответа

Unicode - обычно работающий с ним в C++

Предположим, что у нас есть произвольная строка, s. s имеет свойство того, чтобы быть от примерно где угодно в мире. Люди из США, Японии, Кореи, России, Китая и Греции вся запись в s время от времени...
вопрос задан: 24 February 2010 17:15
4
ответа

Ruby 1.9 еще не поддерживает нормализацию Unicode

Я пытаюсь портировать по некоторым моим старым приложениям для направляющих к Ruby 1.9, и я продолжаю получать предупреждения о том, как "Ruby 1.9 еще не поддерживает нормализацию Unicode". Я разыскал его к этой функции, но мне'...
вопрос задан: 6 February 2010 06:43
4
ответа

Ява: “\\uFFFF Последовательности Новообращенного” в случайную работу

Есть ли стандартный метод, чтобы преобразовать последовательность как «\uFFFF» в характер, означающий, что последовательность шести характеров содержит представление одного unicode характера?
вопрос задан: 24 January 2010 10:16
4
ответа

Эквивалент, чтобы натянуть ascii_letters для unicode натягивает у питона 2.x?

В модуле «последовательности» стандартной библиотеки натяните ascii_letters ## То же как последовательность ascii_lowercase +, последовательность ascii_uppercase - 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ', там...
вопрос задан: 24 January 2010 09:26
4
ответа

Преобразуйте Unicode в ASCII, не изменяя длину строки (в Java)

Что лучший способ состоит в том, чтобы преобразовать строку от Unicode до ASCII, не изменяя, это - длина (который очень важен в моем случае)? Также символы без любых проблем преобразования должны быть в том же...
вопрос задан: 19 January 2010 20:54
4
ответа

В Windows, когда необходимо использовать “\\\\\? \\” префикс имени файла?

Я столкнулся с c библиотекой для вводных файлов, учитывая имя файла Unicode. Прежде, чем открыть файл, это сначала преобразовывает имя файла в путь путем предварительного ожидания "\\? \". Есть ли любая причина сделать это кроме...
вопрос задан: 14 January 2010 13:45
4
ответа

Я должен использовать символы с диакритикой в URL?

Когда каждый создает веб-контент на языках, отличающихся, чем английский язык проблема с поисковой системой появляются, оптимизированные и удобные для пользователя URL. Я задаюсь вопросом, является ли это лучшей практикой для использования de-accented...
вопрос задан: 10 January 2010 15:26
4
ответа

Unicode к преобразованию строк в Java

Я создаю язык, игрушечный язык. Синтаксис \#0061, как предполагается, преобразовывает данный Unicode в символ: Строковый временный файл = yytext () .subtring (2); Затем после той попытки добавить '\u' к...
вопрос задан: 21 December 2009 08:14
4
ответа

Моноширинный Шрифт юникода

Кто-либо может сказать мне моноширинный шрифт, который покрывает большинство unicode символов, Если не тогда моноширинный шрифт, который содержит большую часть европейского набора символов языка?
вопрос задан: 21 December 2009 07:14
4
ответа

ISO-8859-1 по сравнению с UTF-8?

Что должно использоваться и когда? или всегда лучше использовать UTF-8 всегда? или ISO-8859-1 все еще имеет важность в особых условиях? Набор символов связан с географическим регионом?Править: Есть ли...
вопрос задан: 12 December 2009 07:57
4
ответа

Преобразуйте октеты UTF-8 в unicode кодовые точки

У меня есть ряд октетов UTF-8, и я должен преобразовать их назад в unicode кодовые точки. Как я могу сделать это в Python. например, октет UTF-8 ['0xc5', '0x81'] должен быть преобразован в 0x141 кодовую точку.
вопрос задан: 8 December 2009 04:59
4
ответа

Что такое внутреннее представление строки в Python 3.x

В Python 3.x строка состоит из объектов порядкового Unicode. (См. цитату из ссылки языка ниже.), Каково внутреннее представление строки Unicode? Это - UTF-16? Объекты...
вопрос задан: 3 December 2009 08:37
4
ответа

Что 'u' означает в списке?

Это - первый раз, когда я имею, столкнулся с этим. Просто распечатанный список и каждый элемент, кажется, имеют u перед ним т.е. [u'hello', u'hi', u'hey'] Что означает и почему список имел бы...
вопрос задан: 10 November 2009 16:32
4
ответа

Отображение unicode символы в HTML

Я хочу просто отобразить галочку (✔) и крест (✘) символы в странице HTML, но это обнаруживается или как поле или как самодовольный дурак âœ\” - очевидно, что-то, чтобы сделать с кодированием. Я установил метатег для показа...
вопрос задан: 8 November 2009 14:02
4
ответа

Можно ли использовать Unicode «argv»?

Я пишу небольшую оболочку для приложения, которое использует файлы в качестве аргументов. Оболочка должна быть в Unicode, поэтому я использую wchar_t для символов и строк, которые у меня есть. Теперь я нахожусь в ...
вопрос задан: 3 November 2009 00:20
4
ответа

Как реализовать сопоставление строк Unicode путем сворачивания в Python

У меня есть приложение, реализовывая возрастающий поиск. У меня есть каталог строк unicode, которые будут согласованы и будут соответствовать им к данной "ключевой" строке; строка каталога является "хитом", если она содержит весь из...
вопрос задан: 12 September 2009 19:25
4
ответа

Как новые строковые типы работают в Delphi 2009/2010?

Я должен преобразовать большое унаследованное приложение в Delphi 2009, который использует строки, AnsiStrings, WideStrings и данные UTF8 повсеместно, и мне приходится нелегко, чтобы понять как новые строковые типы...
вопрос задан: 9 September 2009 12:52
4
ответа

Что Microsoft использует в качестве типа данных для Строк Unicode?

Я нахожусь в процессе изучения C++ и столкнулся со статьей о MSDN здесь: http://msdn.microsoft.com/en-us/magazine/dd861344.aspx В первом примере кода одна строка кода, который мой...
вопрос задан: 27 August 2009 10:45
4
ответа

Кусочное преобразование приложения MFC к Unicode/MBCS

У меня есть большое приложение MFC, которое я расширяю для обеспечения многоязычного входа. В данный момент я должен позволить пользователю вводить данные Unicode в окна редактирования на единственном диалоговом окне. Есть ли путь к...
вопрос задан: 24 August 2009 15:04
4
ответа

Я могу заставить мерзавца распознать файл UTF-16 как текст?

Я отслеживаю Виртуальный файл виртуальной машины ПК (*.vmc) в мерзавце, и после создания мерзавца изменения идентифицировал файл как двоичный файл, и не будет разность он для меня. Я обнаружил, что файл был закодирован в UTF-...
вопрос задан: 19 August 2009 15:57
4
ответа

Как избавиться от символов неASCII в рубине

У меня есть CGI Ruby (не направляющие), который выбирает фотографии и подписи из веб-формы. Мои пользователи очень увлечены использованием умных кавычек и лигатур, они вставляют из других источников. Мое веб-приложение не имеет дело...
вопрос задан: 12 August 2009 19:47