4
ответа

Как получить строковые объекты вместо Unicode от JSON?

Я использую Python 2 для парсинга JSON от закодированных текстовых файлов ASCII. При загрузке этих файлов или json или simplejson, все мои строковые значения брошены к объектам Unicode вместо строковых объектов...
вопрос задан: 29 October 2018 06:33
4
ответа

Преобразование TMemoryStream для 'представления в виде строки' в Delphi 2009

У нас был следующий код до Delphi 2009: функционируйте MemoryStreamToString (M: TMemoryStream): Строка; var NewCapacity: Двойное целое; начните если (M.Size => 0) или (M.Memory = ноль) затем...
вопрос задан: 10 October 2018 10:31
4
ответа

SQLite, Python, unicode, и non-utf данные

Я запустил путем попытки сохранить строки в sqlite использование Python и получил сообщение: sqlite3. ProgrammingError: Вы не должны использовать 8-разрядные строки байтов, если Вы не используете text_factory, который может интерпретировать...
вопрос задан: 28 July 2018 09:25
4
ответа

Допустимые символы в имени класса Java

Какие символы допустимы в имени класса Java? Что другие правила управляют именами классов Java (например, имена классов Java не могут начаться с числа)?
вопрос задан: 18 January 2018 02:48
4
ответа

Каков текущий современный термин для “Многобайтового набора символов”

Я раньше путал долгое время: Беспорядок на Unicode и Многобайтовых Статьях После чтения комментариев всех участников, плюс: Рассмотрение старой статьи (2001 год): http://www....
вопрос задан: 23 May 2017 12:33
4
ответа

Подготовиться к Delphi 2009 и при разработке с Delphi 7?

Я разрабатываю дополнение Word в Delphi 7, но скоро я обновлю его до Delphi 2010, как Вы знаете, так как Delphi версии 2009 представляет новый строковый тип UnicodeString, который равняется строке ключевого слова...
вопрос задан: 23 May 2017 12:18
4
ответа

Символы Unicode в URL

В 2010 Вы служили бы URL, содержащим символы UTF-8 в большом веб-портале? Символы Unicode запрещаются согласно RFC на URL (см. здесь). Они должны были бы быть процентом, закодированным, чтобы быть...
вопрос задан: 23 May 2017 12:18
4
ответа

Текстовая проблема сжатия Твиттера

Постановляет, что Ваша программа должна иметь два режима: кодирование и декодирование. При кодировании: Ваша программа должна взять в качестве входа некоторый человекочитаемый текст Latin1, по-видимому, английский язык. Не имеет значения, если Вы игнориру
вопрос задан: 23 May 2017 12:16
4
ответа

Считайте символы Unicode из параметров командной строки в Python 2.x в Windows

Я хочу, чтобы мой сценарий Python смог считать параметры командной строки Unicode в Windows. Но кажется, что sys.argv является строкой, закодированной в некотором локальном кодировании, а не Unicode. Как я могу читать...
вопрос задан: 23 May 2017 12:10
4
ответа

Вывод unicode представляет в виде строки в приложении консоли Windows

Привет я пытался произвести строку unicode к консоли с iostreams и отказавший. Я нашел это: Используя шрифт юникода в консольном приложении C++ и этом отрывке работы. SetConsoleOutputCP (CP_UTF8); wchar_t s []...
вопрос задан: 23 May 2017 12:10
4
ответа

Самая эффективная хеш-функция Unicode для Delphi 2009

Я нуждаюсь в самой быстрой хеш-функции, возможной в Delphi 2009, который создаст хешированную стоимость от строки Unicode, которая распределит справедливо случайным образом в блоки. Я первоначально запустил с...
вопрос задан: 23 May 2017 12:04
4
ответа

Когда мы должны использовать NVARCHAR/NCHAR вместо VARCHAR/CHAR в SQL Server?

Существует ли правило, когда мы должны использовать типы Unicode? Я видел, что большинство европейских языков (немецкий язык, итальянский, английский язык...) прекрасно в той же базе данных в столбцах VARCHAR. Я смотрю...
вопрос задан: 23 May 2017 12:02
4
ответа

Как правильно обрезать пробелы от строки в Java?

String.trim JDK () метод довольно наивен, и только удаляет управляющие символы ASCII. StringUtils.strip палат общин Apache () немного лучше, но использует Character.isWhitespace JDK (), который...
вопрос задан: 23 May 2017 12:00
4
ответа

Бегло говорят на Вас Unicode уже?

Почти 5 лет назад Joel Spolsky написал эту статью, "Абсолютный минимум Каждый Разработчик программного обеспечения Absolutely, Положительно Должен Знать О Unicode и Наборах символов (Никакие Оправдания!)". Как многие, я читал...
вопрос задан: 23 May 2017 11:45
4
ответа

Усечение unicode, таким образом, это соответствует максимальному размеру при кодировании для проводной передачи

Учитывая строку Unicode и эти требования: строка быть закодированной в некоторый формат последовательности байта (например, UTF-8 или JSON unicode Escape) закодированная строка имеет максимальную длину, Например...
вопрос задан: 23 May 2017 10:31
4
ответа

Что печатает Python (), функция на самом деле делает?

Я смотрел на этот вопрос и начал задаваться вопросом, что на самом деле делает печать. Я никогда не узнавал, как использовать string.decode () и string.encode () для вывода строки unicode в...
вопрос задан: 23 May 2017 10:29
4
ответа

рисунок поля в Python

Платформа: WinXP SP2, Python 2.5.4.3. (activestate распределение), кто-либо следовал в письменной форме за символами рисования поля в Python? Когда я пытаюсь выполнить это: u '\u2501 печати' u '\u2500 печати' печатает u '\...
вопрос задан: 23 May 2017 10:27
4
ответа

Как закрыть кавычки, urlencoded unicode представляет в виде строки в Python?

У меня есть строка unicode как "Tanım", который кодируется как "Tan%u0131m" так или иначе. Как я могу преобразовать эту закодированную строку назад в исходный unicode. По-видимому, urllib.unquote не поддерживает unicode.
вопрос задан: 14 May 2017 10:34
4
ответа

Почему Python, декодируют замену больше, чем недопустимые байты от закодированной строки?

Попытка декодировать недопустимую закодированную utf-8 страницу HTML дает различные результаты в Python, Firefox и хроме. Недопустимый закодированный фрагмент от тестовой страницы похож на 'PREFIX\xe3\xabSUFFIX'>>>...
вопрос задан: 14 July 2016 09:08
4
ответа

JavaScript + Unicode regexes

Как я могу использовать осведомленные о Unicode регулярные выражения в JavaScript? Например, должно быть что-то сродни \w, который может соответствовать любой кодовой точке в категории Letters или Marks (не только ASCII)...
вопрос задан: 6 June 2016 12:54
4
ответа

Строка Python печатает как [u'String']

Это, конечно, будет легким, но оно действительно прослушивает меня. У меня есть сценарий, который читает на веб-странице и использует Красивый Суп для парсинга его. От супа я извлекаю все ссылки, как моя заключительная цель к...
вопрос задан: 14 April 2016 11:21
4
ответа

Как я могу преобразовать кодовую точку Unicode (\uXXXX) в символ в Perl?

У меня есть некоторые unicode кодовые точки (\u5315\u4e03\u58ec\u4e8c\u4e0a\u53b6\u4e4b), который я должен преобразовать в фактические символы, которые они представляют. Что самый простой путь состоит в том, чтобы сделать так?
вопрос задан: 21 February 2016 21:04
4
ответа

Удалить не-ASCII символы из строки, используя python / django

У меня есть строка HTML, хранящаяся в базе данных. К сожалению, он содержит символы, такие как ® Я хочу заменить эти символы их HTML-эквивалентом, либо в самой БД, либо с помощью Find ...
вопрос задан: 22 November 2015 01:34
4
ответа

Ошибка пакета импорта - не может преобразовать между Unicode и не типом данных String Unicode

Я сделал dtsx пакет на своем использующем компьютеры SQL Server 2008. Это импортирует данные из разграниченного файла CSV точки с запятой в таблицу, где все типы поля являются NVARCHAR МАКСИМУМ. Это продолжает работать мой...
вопрос задан: 25 September 2015 18:11
4
ответа

символы unicode появляются как вопросительные знаки в консоли IntelliJ IDEA

Я пытаюсь записать unicode символы (♠) использующий System.out, и вопросительный знак печатается вместо этого. Как мне можно было отобразить надлежащие unicode символы вместо вопросительных знаков? Я использую...
вопрос задан: 5 May 2015 22:54
4
ответа

Как сохранить unicode в MySQL?

Как я храню Unicode в свободном выпуске MySQL? Кажется, нет типа nvarchar как в SQL Server. Разве Unicode не поддерживается в MySQL? Я пытался использовать текст, но это также не работает.
вопрос задан: 5 May 2015 08:02
4
ответа

Почему я не могу использовать символы с диакритикой рядом с границей слова?

Я пытаюсь сделать динамический regex, который соответствует имени человека. Это работает без проблем над большинством имен, пока я не столкнулся с символами с диакритикой в конце имени. Пример: Некоторый Необычный Namé...
вопрос задан: 4 April 2015 19:04
4
ответа

Как найти, имеет ли конкретная строка unicode символы (особенно. Двухбайтовые символы)

Чтобы быть более точным, я должен знать, могу ли (и, если возможно, как) я найти, имеет ли данная строка двухбайтовые символы или нет. В основном я должен открыть всплывающее окно для отображения данного текста который...
вопрос задан: 14 October 2014 13:42
4
ответа

Удаление диакритических знаков на польском языке

Я пытаюсь удалить диакритические знаки из панграммы на польском языке. Я использую код из блога Майкла Каплана http://www.siao2.com/2007/05/14/2629747.aspx, однако безуспешно. Подумайте ...
вопрос задан: 8 October 2014 17:04
4
ответа

Как Вы создали бы строку всех символов UTF-8?

Существует много способов представить +1 миллион символов UTF-8. Возьмите латинский капитал "A" с макроном (Ā). Это - unicode кодовая точка U+0100, шестнадцатеричное число 0xc4 0x80, десятичное число 196 128, и...
вопрос задан: 14 April 2014 02:26