2
ответа

sed regex Ошибка недопустимого диапазона для диапазона Unicode [дубликат]

| sed 's / [\ u0600- \ u06FF] / & amp; / g '\ Я получаю следующую ошибку для указанного выше выражения. sed: -e выражение # 1, char 22: Недопустимый конец диапазона. Хотя я проверял, что выражение ...
вопрос задан: 9 January 2018 20:38
2
ответа

Световой сигнал C Библиотека Unicode [закрывается]

Я ищу небольшую библиотеку C для обработки строк utf8. А именно, разделяя на основе unicode разделителей для использования с алгоритмами стемминга. Связанные сообщения предложили: ICU http://www.icu-...
вопрос задан: 14 December 2017 19:58
2
ответа

regexp с российским Ленгом

Я не могу решить свою проблему с regexp. Хорошо, когда я ввожу: $string = preg_replace (" #\\[называют = ([a-zA-Z0-9.-] +) *]# "," $name_end за 1$name_start $", $string); все в порядке, кроме ситуации с русским языком...
вопрос задан: 25 November 2017 23:23
2
ответа

Как я могу выполнить итерации через unicode кодовые точки Строки Java?

Таким образом, я знаю о String#codePointAt (интервал), но он индексируется символьным смещением, не смещением кодовой точки. Я думаю о попытке чего-то как: использование String#charAt (интервал) для получения символа в...
вопрос задан: 18 July 2017 16:47
2
ответа

Вывод строки Unicode C #

У меня есть функция для преобразования строки в строку Unicode: частная строка UnicodeString (текст строки) {вернуть Encoding.UTF8.GetString (Encoding.ASCII.GetBytes (текст)); } Но когда я вызываю это ...
вопрос задан: 1 July 2017 14:10
2
ответа

Символы C# Button Text Unicode

C# не хочет помещать символы Unicode на кнопки. Если я поместил \u2129 в текстовый атрибут кнопки, кнопка отображает \u2129, не символ Unicode, (пример - я выбрал 2129 потому что я...
вопрос задан: 23 May 2017 12:24
2
ответа

File.listFiles () изменяет имена Unicode с помощью JDK 6 (проблемы с нормализацией Unicode)

Я борюсь с проблема с кодировкой странного имени файла при выводе содержимого каталогов в Java 6 как в OS X, так и в Linux: File.listFiles () и связанные с ним методы, похоже, возвращают имена файлов в ...
вопрос задан: 23 May 2017 12:16
2
ответа

Как я правильно реализую пароли Unicode?

Добавление поддержки паролей Unicode это важная функция, которая не должна быть проигнорирована разработчиками. Однако, добавление поддержки Unicode в паролях является хитрым заданием, потому что тот же текст может быть...
вопрос задан: 23 May 2017 12:14
2
ответа

Как я могу использовать ToUnicode, не повреждая поддержку мертвой клавиши?

Подобный вопрос уже задали, таким образом, я не пропадаю зря время, повторно объясняя это, существующее обсуждение может быть найдено здесь: ToAscii/ToUnicode в захвате клавиатуры уничтожает мертвые клавиши...
вопрос задан: 23 May 2017 12:13
2
ответа

Инструмент для преобразования источника кода от кодовой страницы до UTF-8?

Я работаю над проектом с открытым исходным кодом. Исходный проект содержит комментарии на русском языке и использует кодовую страницу 1251. Я использую кодовую страницу 1252, и российские комментарии не отображены правильно в...
вопрос задан: 23 May 2017 12:08
2
ответа

Python: Санировать строку для unicode? [дубликат]

Возможный Дубликат: Python UnicodeDecodeError - Является мной, недоразумение кодирует? У меня есть строка, которую я пытаюсь сделать безопасным для unicode () функция:>>> s = "нечто “ласка” панели панели" и...
вопрос задан: 23 May 2017 12:00
2
ответа

Запись строки к TFileStream в Delphi 2010

У меня есть код Delphi 2007 года, который похож на это: процедура WriteString (Поток: TFileStream; var SourceBuffer: PChar; s: строка); начните StrPCopy (SourceBuffer, s); Поток. Запишите (SourceBuffer[0], StrLen (...
вопрос задан: 23 May 2017 11:45
2
ответа

Как инвертировать строку Unicode

Подсказалось в комментарии ответу на этот вопрос, что PHP не может инвертировать строки Unicode. Что касается Unicode, это работает в PHP, потому что большинство приложений обрабатывает его как двоичный файл. Да, PHP является 8-разрядным...
вопрос задан: 23 May 2017 11:45
2
ответа

Какое кодирование имена файлов в NTFS, сохраненном как?

Я просто начинаю на некотором программировании обрабатывать имена файлов с неанглийскими именами в системе WinXP. Я сделал некоторое рекомендуемое чтение на unicode, и я думаю, что получаю общее представление, но некоторых...
вопрос задан: 3 April 2017 15:07
2
ответа

Используя awk для удаления метки Порядка байтов

Как awk написал бы сценарий (по-видимому, острота) для удаления BOM похожи? Спецификация: распечатайте каждую строку после первого (НОМЕР> 1) для первой строки: Если это запускается с #FE #FF или #FF #FE...
вопрос задан: 15 March 2017 07:52
2
ответа

Как заставить python 3 print () utf8

Как заставить python 3 (3.1) печатать ("Some text") на стандартный вывод в UTF-8 или как вывести raw байт? Test.py TestText = "Test - āĀēĒčČ..šŠūŪžŽ" # это UTF-8 TestText2 = b "Test2 - \ xc4 \ x81 \ xc4 \ x80 \ xc4 \ ...
вопрос задан: 14 March 2017 18:33
2
ответа

Идентификаторы Unicode в Python?

Я хочу создать функцию Python, которая вычисляет и хотела бы назвать мою функцию суммирования Σ. Подобным способом, хотел бы использовать Π для продукта, и так далее. Я задавался вопросом, был ли путь...
вопрос задан: 8 February 2017 04:23
2
ответа

Unicode, UTF, ASCII, различия в формате ANSI

Каково различие между Unicode, UTF8, UTF7, UTF16, UTF32, ASCII и кодировкой ANSI? Каким образом они полезны для программистов?
вопрос задан: 27 January 2017 01:32
2
ответа

Python: Используя .format () на оставленной из Unicode строке

Я использую Python 2.6.5. Мой код требует использования "больше чем или равный" знаку. Здесь это идет:>>> s = u '\u2265'>>> печатают s>>> ≥>>> печать "{0}" .format (s)...
вопрос задан: 9 January 2017 09:48
2
ответа

Делает C++ 0x, поддерживают станд.:: преобразование wstring в последовательность байта UTF-8?

Я видел, что C++ 0x добавит поддержку UTF-8, UTF-16 и литералов UTF-32. Но что относительно преобразований между этими тремя представлениями? Я планирую использовать станд.:: wstring везде в моем коде. Но я также...
вопрос задан: 2 November 2016 08:44
2
ответа

Парсинг unicode вход с помощью Python json.loads

Что лучший способ состоит в том, чтобы загрузить Строки JSON в Python? Я хочу использовать json.loads для обработки unicode как это: импортируйте json json.loads (unicode_string_to_load), я также пытался предоставить 'кодирование'...
вопрос задан: 8 August 2016 21:18
2
ответа

Быстрый способ отфильтровать недопустимый xml unicode символы в Python?

Спецификация XML перечисляет набор символов Unicode, которые являются или запрещенными или "нежелательными". Учитывая строку, как я могу удалить все запрещенные символы из него? Я придумал следующее...
вопрос задан: 9 May 2016 15:46
2
ответа

Как я могу преобразовать входной файл в кодировку UTF-8 в Perl?

Я уже знаю, как преобразовать non-utf8-encoded содержание файла линию за линией к UTF-8, кодируют, с помощью чего-то как следующий код: # outfile.txt находится в ГБ 2312, кодируют открытый мой $filter", <...
вопрос задан: 19 February 2016 08:37
2
ответа

Как произвести строку unicode к RTF (использующий C#)

Я пытаюсь произвести строку unicode в RTF-формат. (использующий c# и winforms) Из Википедии: Если Escape Unicode требуется, управляющее слово \u используется, сопровождается 16-разрядным десятичным числом со знаком...
вопрос задан: 18 December 2015 14:20
2
ответа

Удивительное поведение с ключами unicode dict [duplicate]

Рассмотрим следующий фрагмент кода: В [1]: a = {'ε': 1} В [2]: b = dict (ε = 1) В [3]: a == b Out [3]: False In [4]: print (a, b) {'ε': 1} {'ε': 1} Я был удивлен, узнав, что а не равно ...
вопрос задан: 5 December 2015 00:43
2
ответа

Почему Swift изменяет порядок юникода в строке? [Дубликат]

Когда я объединяю группу юникодов в строке, Swift меняет порядок этих юникодов. final_word.append (String (UnicodeScalar (Int (слово !, radix: 16)!)!)) Этот код добавляет к строке ...
вопрос задан: 2 November 2015 03:16
2
ответа

Хранение UTF-16/Unicode данных в SQL Server

Согласно этому, SQL Server 2K5 использует UCS-2 внутренне. Это может хранить данные UTF-16 в UCS-2 (с соответствующими типами данных, nchar и т.д.), однако если существует дополнительный символ, это хранится как 2...
вопрос задан: 30 September 2015 14:58
2
ответа

Необходимо заменить символы emoji своим значением Unicode [duplicate]

Я новичок в python, и в настоящее время я работаю с проектом, который требует анализа emojis в комментариях пользователей. Их мне нужно заменить emojis в строке с их значениями unicode. Вот мой код ...
вопрос задан: 28 September 2015 16:21
2
ответа

Шрифты юникода в PyGame

Как я могу отобразить китайские символы в PyGame? И что хороший free/libre шрифт должен использовать с этой целью?
вопрос задан: 11 August 2015 15:13
2
ответа

Как “вызвать” файл ISO-8859-1ness?

Я помню, когда я раньше разрабатывал веб-сайт в Японии - где существует три различных кодировки символов в валюте - у разработчиков был прием для "вызывания" кодирования исходного файла, таким образом, это будет...
вопрос задан: 30 July 2015 16:27