3
ответа

Практическое руководство определяет, что UTF-8 закодировал строки

Что состоит в том, чтобы определить лучший способ, могла ли строка (или) быть закодированным UTF-8? Win32 API IsTextUnicode не помогает здесь. Кроме того, строка не будет иметь BOM UTF-8, так, чтобы не мог быть проверен...
вопрос задан: 18 December 2008 09:07
3
ответа

Python UnicodeDecodeError - Является мной, недоразумение кодирует?

Какие-либо мысли о том, почему это не работает? Я действительно думал, 'игнорируют', сделал бы правильную вещь.>>>, 'добавляют \x93Monitoring\x93 для списка '.encode ('латинский 1', 'проигнорируйте'), Traceback (новый вызов в последний раз)...
вопрос задан: 15 December 2008 15:57
3
ответа

Как я рассматриваю строку ASCII как unicode и невыхожу из завершенных символов в ней в Python?

Например, если у меня есть строка unicode, я могу закодировать ее строкой ASCII как так:>>> ('ASCII') u '\u003cfoo/\u003e '.encode '<нечто/>' Однако я имею, например, эта строка ASCII: '\...
вопрос задан: 6 November 2008 01:55
3
ответа

Самый простой способ преобразовать unicode кодовую точку в UTF-8

Что самый простой путь состоит в том, чтобы преобразовать кодовую точку Unicode в последовательность байта UTF-8 в C? Единственный путь, который приходит на ум, использует iconv для отображения от кодовой страницы UTF-32LE до UTF-8, но это походит...
вопрос задан: 5 November 2008 13:52
3
ответа

Что лучший способ состоит в том, чтобы преобразовать TBytes (UTF-16) в строку?

Что лучший способ состоит в том, чтобы преобразовать массив байтов, объявленных как TBytes к строке unicode в Delphi 2009? В моем особом случае массив TBytes уже имеет закодированные данные UTF-16 (2 байта для каждого символа)....
вопрос задан: 3 November 2008 21:15
3
ответа

Сохранение 'дерева/f/a" заканчивается к текстовому файлу с поддержкой unicode

Я пытаюсь использовать древовидную команду в командной строке окон для генерации текстового файла, перечисляющего содержание каталога, но когда я передаю вывод по каналу, unicode символы наполнены. Вот...
вопрос задан: 10 October 2008 19:06
3
ответа

Декодирование URL Unicode

Обычный метод кодирования URL unicode символ должен разделить его на 2 кода %HH. (\u4161 => %41%61), Но, как unicode отличают при декодировании? Как Вы знаете, что %41%61 \u4161 по сравнению с \...
вопрос задан: 1 October 2008 01:44
3
ответа

Получение международных символов от веб-страницы? [дубликат]

Я хочу очистить некоторую информацию от футбола (футбол) веб-страница с помощью простого regexp's Python. Проблема состоит в том, что игроки, такие как первый парень, ÄÄRITALO, выходят как &#196; &#196; RITALO!...
вопрос задан: 26 September 2008 00:53
3
ответа

Будет все в стандартных строках обработки библиотеки как unicode в Python 3.0?

Я немного смущен тем, как стандартная библиотека будет вести себя теперь, когда Python (от 3,0) является находящимся в unicode. Будут модули, такие как CGI и urllib используют строки unicode, или будут они использовать новые 'байты'...
вопрос задан: 18 September 2008 09:29
2
ответа

Каково название сущности HTML для индийской рупии

Я знаю, что мы можем использовать номера сущностей & amp; # x20b9; и & # 8377; для отображения символа индийской рупии (₹). Но поскольку у фунта есть имя сущности & amp; фунт;
вопрос задан: 9 May 2019 09:32
2
ответа

Соответствует ли Javascript string.toLowerCase () стандартам Unicode при преобразовании регистра?

Я создаю сценарий проверки формы на основе браузера, который проверяет, нет ли во вводе символов верхнего регистра в соответствии со стандартами Unicode. Мое определение символа верхнего регистра - это ...
вопрос задан: 3 May 2019 05:48
2
ответа

Юникод ошибка колба jinja2

Я ищу, чтобы создать веб-страницу с Python на колбу, все работает очень хорошо, и я бы очень рекомендовал колбу. Но когда дело доходит до Unicode et кодирование всегда трудно между питоном ...
вопрос задан: 20 April 2019 15:04
2
ответа

Каковы различия между utf8_general_ci и utf8_unicode_ci? [дубликат]

Возможный Дубликат: каково различие между utf8_general_ci и utf8_unicode_ci, у меня есть две опции для unicode, которые ищут обещание mysql базы данных. utf8_general_ci unicode (...
вопрос задан: 25 March 2019 03:31
2
ответа

Как вывести Unicode Box рисунок в C ++?

Извините за то, что может показаться простым, но я пытаюсь нарисовать простую рамку в Visual Studio 2017, используя символы Юникода из https://en.wikipedia.org/wiki/Box-drawing_character, используя код ...
вопрос задан: 22 March 2019 14:40
2
ответа

Неанглийская строка в весенней загрузке

Я пытаюсь создать такую ​​строку в Spring Boot: model.setBody ("Bạn đã nhận được một báo cáo mới"); но когда я использую model.getBody (). toString (), я получил странную строку вроде этой: B? ...
вопрос задан: 20 March 2019 02:45
2
ответа

Удалить недопустимые символы UNICODE из файла XML в UNIX?

У меня есть сценарий оболочки, который я использую для удаленной очистки XML-файла, созданного другой системой, который содержит недопустимые символы UNICODE. В настоящее время я использую эту команду в сценарии, чтобы удалить ...
вопрос задан: 18 March 2019 17:41
2
ответа

Как правильно декодировать данные JSON со строками Unicode

Я читаю файл json, где в некоторых полях есть строка, подобная следующей: «Эдуардо Фонсека Бола сравнивает публичные публикации» Окончательный результат должен выглядеть следующим образом ...
вопрос задан: 17 March 2019 22:09
2
ответа

UnicodeDecodeError: кодек 'charmap' не может декодировать байт X в позиции Y: символ отображается на < undefined >

Я пытаюсь заставить программу на Python 3 выполнять некоторые манипуляции с текстовым файлом, заполненным информацией. Однако при попытке прочитать файл я получаю следующую ошибку: Traceback (последний вызов ...
вопрос задан: 7 March 2019 09:42
2
ответа

Как я преобразовываю Управляющих последовательность Unicode в символы Unicode в строке.NET?

Скажите загрузку текстового файла в строку, и требуется преобразовать все Escape Unicode в фактические символы Unicode в строке. Пример: "Следующее является верхней половиной...
вопрос задан: 6 March 2019 20:28
2
ответа

Как декодировать Unicode-строку JSON в Python?

Как я могу напечатать decoded_json ниже, чтобы появились эмодзи? > > > raw_json = '"smile
вопрос задан: 5 March 2019 08:15
2
ответа

Как действительно преобразовывают управляющих последовательность Unicode в unicode символы в строке Python

Когда я пытался получить содержание тега с помощью "unicode (head.contents[3])", я получаю вывод, подобный этому: "Christensen Sk\xf6ld". Я хочу, чтобы escape-последовательность была возвращена как строка. Как сделать это...
вопрос задан: 25 February 2019 13:23
2
ответа

Как использовать Unicode :: Normalize для создания наиболее совместимой строки в кодировке Windows-1252?

У меня есть устаревшее приложение на Perl, которое, скорее всего, обрабатывает XML, закодированный в UTF-8, и которому нужно хранить некоторые данные этого XML в некоторой базе данных, которая использует windows-1252 по историческим причинам. Да, эта наст
вопрос задан: 21 January 2019 13:41
2
ответа

PowerShell Core не распознает юникод

У меня есть простой сценарий PowerShell Core: $ Message = [IO.File] :: ReadAllText ("$ PSScriptRoot \ русский.txt", [System.Text.Encoding] :: Default) $ Сообщение Насколько мне известно, PowerShell Core UTF-8 по умолчанию. ...
вопрос задан: 16 January 2019 11:45
2
ответа

Сложность работы с Unicode от sys.stdin

Это сводит меня с ума в данный момент. Из моих последних дней исследований ясно, что юникод - сложная тема. Но вот поведение, которое я не знаю, как обратиться. Если я читаю файл ...
вопрос задан: 15 January 2019 16:46
2
ответа

Избегание UnicodeEncodeError в python

Я попытался разобрать таблицу html в csv, используя python со следующим скриптом: из bs4 import. Импорт запросов BeautifulSoup импортирует csv csvFile = open ('log.csv', 'w', newline = '') writer = csv.writer (. ..
вопрос задан: 13 July 2018 15:12
2
ответа

Как перенаправить к URL строки запроса, содержащему символы неASCII в DJANGO?

Как перенаправить к URL строки запроса, содержащему символы неASCII в DJANGO? Когда я использую, возвращают HttpResponseRedirect (u '/page/? заголовок =' + query_string), где query_string содержит символы...
вопрос задан: 14 June 2018 04:59
2
ответа

Со знаком из символа и Unicode в C++ 0x

От C++ 0x работающий проект, новые символьные типы (char16_t и char32_t) для обработки Unicode будет не подписан (uint_least16_t, и uint_least32_t будет базовыми типами). Но насколько я могу...
вопрос задан: 5 April 2018 14:38
2
ответа

печатаемый символ в Java

Кто-либо знает, как обнаружить печатаемые символы в Java? Через некоторое время (пробная версия/ошибка) я добираюсь до этого метода: общедоступная булевская переменная isPrintableChar (символ c) {Символ. Блок UnicodeBlock =...
вопрос задан: 28 March 2018 15:28
2
ответа

Сортировка JavaScript для соответствия сортировке SQL Server

Кто-либо может указать на меня к алгоритму сортировки в JavaScript, который отсортировал бы тот же способ, которым SQL Server делает (для nvarchar/unicode столбцов)? Для ссылки может мой предыдущий вопрос об этом поведении...
вопрос задан: 3 February 2018 18:19
2
ответа

Имена переменной Unicode Java

Я вошел в интересное обсуждение на форуме, где мы обсудили именование переменных. Конвенции в стороне, я заметил, что законно для переменной иметь название символа Unicode, для...
вопрос задан: 18 January 2018 02:48