0
ответов

Что такое селектор вариантов Юникода

Мне было интересно. Для чего используются селекторы вариантов Unicode от U-FE00 до U-FE0F. Пример: ︀︁︂︂
вопрос задан: 14 November 2016 07:06
0
ответов

C # регулярное выражение для удаления непечатаемых символов и управляющих символов в тексте, который состоит из множества разных языков, букв юникода

Я был бы признателен за вашу помощь в этом, так как я не знаю, какой диапазон символов использовать, или есть ли такой класс символов, как [[: cntrl:]], который я нашел в ruby? с помощью не для печати, я ...
вопрос задан: 12 November 2016 15:58
0
ответов

TypeError: приведение к Unicode: нужна строка или буфер, int найдено

У меня есть 2 API. Я получаю данные от них. Я хочу назначить конкретную часть кода для строки, чтобы жизнь стала проще при кодировании. Вот код: импорт urllib2 импорт json urlIncomeStatement ...
вопрос задан: 7 November 2016 15:12
0
ответов

Регулярные выражения и Unicode в Python: разница между sub и findall

Мне сложно найти ошибку в моем скрипте Python (2.7). Я получаю разницу с использованием sub и findall при распознавании специальных символов.Вот код: >>> ...
вопрос задан: 16 October 2016 21:18
0
ответов

Как я могу настроить IDEA для автоматической замены => на ⇒ и -> на →? [дубликат]

Как я могу настроить IDEA для автоматической замены => на ⇒ и -> на →?
вопрос задан: 14 October 2016 20:52
0
ответов

Как декодировать Unicode построчно в Python 2.7?

Правильный способ загрузки текста Unicode из Python 2.7 выглядит примерно так: :content = open ('имя файла' ).read ().decode ('encoding' ):для строки в content.splitlines ():процесс (строка)(Обновление :Нет, это не так....
вопрос задан: 14 October 2016 16:40
0
ответов

Запрет преобразования HTML-сущности в эмодзи

Я закодировал письмо в формате HTML и использую "& # 9654;" кодировать направленный вправо треугольник вместо изображения в призыве к действию. Это отрисовывается, как и ожидалось, за исключением устройств iOS, где эта HTML-сущность ...
вопрос задан: 10 October 2016 15:41
0
ответов

преобразование узкой строки в широкую

Как я могу преобразовать узкую строку в широкую? Я пробовал этот метод: string myName; getline (cin, myName); wstring имя_принтера (L (myName)); // ошибка C3861: 'L': идентификатор не найден ...
вопрос задан: 6 October 2016 21:06
0
ответов

Разобрать не ascii (unicode) числовая строка как целое число в .NET

У меня есть строка, содержащая число в формате, отличном от ascii, например unicode BENGALI DIGIT ONE (U + 09E7): "১" Как мне разобрать это как целое число в .NET? Примечание: я пробовал использовать int.Parse (), указав ...
вопрос задан: 4 October 2016 13:14
0
ответов

Почему языки сценариев не выводят Unicode на консоль Windows?

Консоль Windows поддерживает Unicode как минимум десять лет, а возможно, еще даже в Windows NT. Однако по какой-то причине основные кроссплатформенные языки сценариев, включая Perl и Python ...
вопрос задан: 2 October 2016 03:21
0
ответов

CSS: после кодирования символов в содержимом

я использую следующий CSS, который, похоже, работает: a.up : после {содержания: " a.down: after {content: "↑";} Однако, похоже, символы не могут быть закодированы таким образом, так как вывод ...
вопрос задан: 20 September 2016 12:39
0
ответов

Лучший способ преобразования между [Char] и [Word8]?

Я новичок в Haskell и пытаюсь использовать чистую реализацию SHA1 в своем приложении (Data.Digest.Pure. SHA) с библиотекой JSON (AttoJSON). AttoJSON использует байтовые строки Data.ByteString.Char8, SHA использует данные ....
вопрос задан: 24 August 2016 19:29
0
ответов

How does a Unicode character get mapped to a glyph in a font?

I am wondering, that each char in Unicode has a code point; what's the analogous term for a character in a font? I never understood the part of the process when a decoded file needs to be mapped to ...
вопрос задан: 17 August 2016 14:32
0
ответов

Удаление символов, отличных от ASCII, из файлов данных

У меня есть куча CSV-файлов, которые я читаю в R и включаю в папку package/data в . формат rdata. К сожалению, не-ASCII-символы в данных не проходят проверку. В пакете инструментов есть ...
вопрос задан: 12 August 2016 08:03
0
ответов

Что такое кодировка argv?

Мне не ясно, какие кодировки используются в argv Си. В частности, меня интересует следующий сценарий: пользователь использует локаль L1 для создания файла с именем N, не содержащим ASCII ...
вопрос задан: 21 July 2016 11:42
0
ответов

Все ли символы кандзи в UTF-8 имеют длину 3 байта?

Кто-нибудь может подтвердить, что все символы кандзи в китайском языке имеют длину 3 байта в UTF-8?
вопрос задан: 16 July 2016 02:28
0
ответов

Как передавать символы Unicode как JSP/ Сервлет request.getParameter?

После долгих проб и ошибок я все еще не могу понять проблему. JSP, сервлет и база данных настроены на прием кодировки UTF-8, но даже когда я использую request.getParameter для чего-либо...
вопрос задан: 7 July 2016 12:59
0
ответов

В Python, как перечислить все символы, соответствующие расширенному регулярному выражению POSIX `[: space:]`?

Как в Python перечислить все символы, соответствующие расширенному регулярному выражению POSIX [: space:]? Существует ли программный способ извлечения кодовых точек Unicode, охватываемых [: space:]?
вопрос задан: 19 June 2016 02:35
0
ответов

Как поместить дополнительный символ Unicode в строковый литерал?

Как поместить дополнительный символ Unicode (скажем, кодовая точка 10400) в строковый литерал ? Я пробовал поместить суррогатную пару следующим образом: String text = "TEST \ uD801 \ uDC00"; System.out.println (text); ...
вопрос задан: 2 June 2016 08:37
0
ответов

Кодирование с помощью HttpClient в .NET 4.5

Я использую некоторые данные, используя API-интерфейс Fogbugz XML. Этот API всегда предлагает данные в формате UTF-8. При использовании класса WebClient для выполнения запроса я могу установить кодировку. Например: var result = ...
вопрос задан: 25 May 2016 13:05
0
ответов

Тестовые строки Unicode для модульных тестов

Мне нужны несколько тестовых строк Utf32 для выполнения некоторого межплатформенного кода манипуляции строками. Мне нужен набор тестовых строк, в которых используются кодировки utf32 <-> utf16 <-> utf8 для проверки этого ...
вопрос задан: 17 May 2016 01:53
0
ответов

Что означает сортировка в неалфавитных (например, азиатских) языках?

У меня есть код, который сортирует столбцы таблицы по свойствам объекта. Мне пришло в голову, что в японском или китайском (не алфавитные языки) строки, которые отправляются в функцию сортировки, будут ...
вопрос задан: 27 April 2016 17:13
0
ответов

Найти символы, которые похожи по глифу в Unicode?

Допустим, у меня есть символы Ú, Ù, Ü. Все они глифически похожи на английское U. Есть ли какой-то список или алгоритм для этого: если Ú, Ù или Ü, верните английское U Учитывая английскую букву U, ...
вопрос задан: 12 March 2016 17:03
0
ответов

Какова цель Unicode «Backspace» U + 0008?

Какова цель Unicode-символа «BACKSPACE» (U + 0008) в программировании? Для каких приложений его можно использовать?
вопрос задан: 7 March 2016 12:26
0
ответов

MIMEText Проблемы с кодировкой UTF-8 при отправке электронной почты

Вот часть моего кода, которая отправляет электронное письмо: servidor = smtplib. SMTP () servidor.connect (HOST, PORT) servidor.login (user, usenha) assunto = str (self.lineEdit.text ()) {{1} } para = str (global_email) ...
вопрос задан: 29 February 2016 01:58
0
ответов

Отправить не-ASCII запрос POST в Python?

I ' m пытается отправить запрос POST в веб-приложение. Я использую модуль Mechanize (сам является оболочкой urllib2). В любом случае, когда я пытаюсь отправить запрос POST, я получаю UnicodeDecodeError: кодек ascii не может. ..
вопрос задан: 29 February 2016 01:53
0
ответов

Python получить код символа в другой кодировке?

Учитывая символ код как целое число в одной кодировке, как вы можете получить код символа, скажем, в utf-8 и снова как целое число?
вопрос задан: 29 February 2016 01:37
0
ответов

'str' не поддерживает буферный интерфейс Python3 от Python2

Привет, у меня есть две эти функции в Py2 работает нормально, но он не работает с кодировкой def Py3 (текст, коды): двоичный = '' f = open ('bytes.bin', 'wb') для c в тексте: двоичный + = коды [с] е ....
вопрос задан: 29 February 2016 01:34
0
ответов

Записать ObjectNode в строку JSON с символами UTF-8 в экранированный ASCII

Я хотел бы записать содержимое ObjectNode Джексона в строку с символами UTF-8, написанными как ASCII (Unicode Escape). Вот пример метода: private String writeUnicodeString () {...
вопрос задан: 10 February 2016 20:03
0
ответов

Как напечатать литеральную строку юникода в Javascript?

У меня есть массив, содержащий строки со специальными символами Юникода: var a = [["a", 33], ["h\u016B", 44], ["s\u00EF", 51], ... ]; Когда я перебираю этот массив: for (i=0;i
вопрос задан: 10 February 2016 04:06