0
ответов

Всегда ли символы UTF16 (используемые, например, функциями wide-winapi) 2 байта?

Пожалуйста, поясните мне, как работает UTF16? Я немного сбит с толку, учитывая эти моменты: в C ++ есть статический тип WCHAR, длина которого составляет 2 байта. (всегда 2 байта, очевидно) Большая часть msdn ...
вопрос задан: 11 January 2011 00:53
0
ответов

Python: преобразование Unicode в ASCII без ошибок для файла CSV

Я читал все вопросы, касающиеся преобразования Unicode в CSV на Python здесь, в StackOverflow, и все еще потерялся. Каждый раз, когда я получаю сообщение «UnicodeEncodeError: кодек ascii не может кодировать ...
вопрос задан: 10 January 2011 19:36
0
ответов

Кодировать в однобайтовые расширенные значения ascii

В C # есть способ кодировать расширенные значения ascii (128-255) в их однобайтовые значения как показано здесь: http://asciitable.com/ Я пробовал использовать Encoding.UTF8.GetBytes (), но это возвращает multi ...
вопрос задан: 7 January 2011 08:46
0
ответов

C library to convert unicode code points to UTF8?

I have to go through some text and write UTF8 output according to the character patterns. I thought it'll be easy if I can work with the code points and get it converted to UTF8. I have been reading ...
вопрос задан: 5 January 2011 17:52
0
ответов

Windows API: ANSI и строки с расширенными символами - это UTF8 или ASCII? UTF-16 или UCS-2 LE?

Я не очень разбираюсь в кодировках, UTF8 - это 8-битный, ...
вопрос задан: 4 January 2011 09:45
0
ответов

Почему wchar_t не используется широко в коде для Linux / связанных платформ?

Это меня заинтриговало, поэтому я « Я собираюсь спросить - по какой причине wchar_t не используется так широко в Linux / Linux-подобных системах, как в Windows? В частности, Windows API использует wchar_t внутри, тогда как я ...
вопрос задан: 3 January 2011 20:59
0
ответов

Заменить все символы с диакритическими знаками их эквивалентами в LaTeX

Учитывая строку Unicode, я хочу заменить символы, отличные от ASCII, на LaTeX код, создающий их (например, когда é становится \ 'e, а œ становится \ oe). Я включаю это в код Python. Это должно ...
вопрос задан: 2 January 2011 14:59
0
ответов

Perl LWP :: UserAgent неверно обрабатывает ответ UTF-8

Когда я использую LWP :: UserAgent для получения содержимого, закодированного в UTF-8, кажется, что LWP :: UserAgent не обрабатывает кодировку правильно. Вот результат, полученный после установки окна командной строки в Unicode с помощью ...
вопрос задан: 1 January 2011 15:01
0
ответов

Преобразование Unicode в Windows-1252 для vCard

Я пытаюсь написать программу на C #, которая разделит файл vCard (VCF) с несколькими контактами на отдельные файлы для каждого контакта. Я понимаю, что vCard необходимо сохранить как ANSI (1252) для ...
вопрос задан: 27 December 2010 15:41
0
ответов

Unicode unknown « » обнаружение символов в PHP

Есть ли в PHP способ обнаружения следующего символа ? В настоящее время я исправляю ряд проблем с кодировкой UTF-8 с помощью нескольких разных алгоритмов, и мне нужно определить, присутствует ли в ...
вопрос задан: 27 December 2010 06:33
0
ответов

Экономия места в кодировке символов для японского языка?

На мой взгляд, общая проблема: кодировка символов в сочетании с растровый шрифт. Большинство многоязычных кодировок имеют огромное пространство между разными типами символов и даже много неиспользуемого кода ...
вопрос задан: 27 December 2010 02:35
0
ответов

Почему Perl теряет иностранные символы в Windows; можно ли это исправить (если да, то как)?

Обратите внимание, как ã изменяется на a. ПРИМЕЧАНИЕ 2. Прежде чем обвинять в этом CMD.EXE и странность конвейера Windows, см. Ниже эксперимент 2, в котором возникает аналогичная проблема с использованием File :: Find. Конкретная проблема я ...
вопрос задан: 25 December 2010 01:18
0
ответов

Освобождение Объект JavaScript

Я смотрю на пример из http://www.javascriptkit.com/javatutors/oopjs.shtml var person = new Object () person.name = "Тим Скарф" который преобразует число в диапазоне 0-0x10FFFF в Unicode ...
вопрос задан: 24 December 2010 00:37
0
ответов

Использование JavaMail для отправки почты, содержащей символы Unicode

Я успешно отправляю электронные письма через SMTP-серверы GMail, используя следующий фрагмент кода: Properties props = new Properties (); props.put ("mail.smtp.host", "smtp.gmail.com"); ...
вопрос задан: 22 December 2010 17:50
0
ответов

How to recognize if a string contains unicode chars?

I have a string and I want to know if it has unicode characters inside or not. (если он полностью содержит ASCII или нет) Как я могу этого добиться? Спасибо!
вопрос задан: 16 December 2010 10:28
0
ответов

Интернационализация в MFC

Наконец (после многих лет откладывания) настало время локализовать мое приложение на несколько других языков, кроме английского. Первая задача - разработать интеграцию в мое приложение C ++ / MFC, которое ...
вопрос задан: 11 December 2010 14:50
0
ответов

UnicodeEncodeError при сохранении ImageField, содержащего не -ASCII-символы в администраторе Django

Я пытаюсь загрузить файл изображения во встроенные строки администратора django и получаю UnicodeEncodeError при попытке загрузить файл с именем файла, содержащим символы, отличные от ascii: File "/ usr / local / lib / python2 .6 / ...
вопрос задан: 11 December 2010 05:33
0
ответов

Oracle Text не будет работать с NVARCHAR2. Что еще может быть недоступно?

Мы собираемся перенести приложение, чтобы оно поддерживало Unicode, и чтобы ему пришлось выбирать между набором символов Unicode для всей базы данных или столбцами Unicode, хранящимися в N [VAR] CHAR2. Мы знаем, что мы ...
вопрос задан: 10 December 2010 09:15
0
ответов

Обработка файлов размером более 2 ГБ в C ++ с помощью STL

Я выполняю двоичную обработку файлов и в своем алгоритме я хотел бы знать фактический тип pos_type и off_type, например, при вычислении размер файла или поиск заданной позиции (...
вопрос задан: 10 December 2010 01:10
0
ответов

список сокращений математических символов LaTeX вместе с символом Unicode

кому-нибудь знаете страницу, на которой перечислены все аббревиатуры математических символов TeX / LaTeX вместе с символом Юникода? мне нужно, чтобы глиф был символом Unicode, а не изображением. Я потратил 20 минут, но не нашел. ...
вопрос задан: 8 December 2010 21:42
0
ответов

Как получить URL-адрес, отличный от ascii, с помощью Python urlopen?

Мне нужно получить данные с URL-адреса с символами, отличными от ascii, но urllib2.urlopen отказывается открывать ресурс и вызывает: UnicodeEncodeError: кодек 'ascii' не может закодировать символ u '\ u0131' в позиции ...
вопрос задан: 8 December 2010 16:33
0
ответов

возвращение LPCWSTR из функции?

Для передачи целочисленного значения в SetWindowTextW (), (Я использую сборку Unicode на C ++ с Visual Studio 2010), достаточно ли этой функции вернуть LPCWSTR? Я почти уверен, что здесь что-то есть ...
вопрос задан: 7 December 2010 17:32
0
ответов

How to set sys.stdout encoding in Python 3?

Setting the default output encoding in Python 2 is a well-known idiom: sys.stdout = codecs.getwriter("utf-8")(sys.stdout) This wraps the sys.stdout object in a codec writer that encodes output in ...
вопрос задан: 7 December 2010 08:15
0
ответов

Недействительный Unicode / XML с Python SimpleXMLRPCServer?

Я получаю следующую ошибку на стороне клиента, когда я передаю недопустимые символы XML на Python SimpleXMLRPCServer: Fault: : not well -...
вопрос задан: 7 December 2010 04:24
0
ответов

iconv: Преобразование из Windows ANSI в UTF-8 с помощью спецификации

Я хочу использовать iconv для преобразования файлов на моем Mac. Цель состоит в том, чтобы перейти от «Windows ANSI» к «тому, что сохраняет Windows Notepad, если вы укажете ему использовать UFT8». Это то, что я хочу: anders-johansen-privats -...
вопрос задан: 6 December 2010 07:32
0
ответов

Какая команда LaTeX создает emdash?

Я знаю, что могу создать длинное тире с помощью --- (и короткое тире с помощью - ). Однако я хочу использовать эти глифы в своей настройке Unicode и попробовать это следующим образом: \ DeclareUnicodeCharacter {2012} {-} \ ...
вопрос задан: 4 December 2010 13:16
0
ответов

Сообщения и журнал коммитов Mercurial, какая кодировка поддерживается, заботится ли Hg вообще?

Я попытался выполнить простую фиксацию через свою библиотеку-оболочку для Mercurial, используя простую текст Unicode: æøåÆØÅ как мое сообщение фиксации. Это записывается в текстовый файл и передается в Mercurial с помощью ...
вопрос задан: 1 December 2010 20:54
0
ответов

Юникод с двойным декодированием в python

Я работаю против приложения, которое, похоже, стремится вернуть, как мне кажется, строки с двойной кодировкой UTF-8. Я отправляю строку u'XüYß ', закодированную с использованием UTF-8, таким образом становясь X \ u00fcY \ u00df (...
вопрос задан: 24 November 2010 14:00
0
ответов

Как обрабатывать азиатские символы в именах файлов в Git на OS X

Я использую американско-английский OSX 10.6 .4 и попытайтесь сохранить файлы с азиатскими символами в имени в репозитории Git. Хорошо, давайте создадим такой файл в рабочем дереве Git: $ touch ど う も あ り が と う ミ ス タ ー ボ ッ ト .txt Git ...
вопрос задан: 23 November 2010 10:27
0
ответов

CharInSet не работает с неанглийными буквами?

Я обновил приложение с Delphi 2007 на Delphi 2010, все прошло нормально, за исключением одного утверждения, которое скомпилировалось нормально, но не работает, которое: Если Edit1.Text[1] в ['S','س'], то ...
вопрос задан: 23 November 2010 09:36