0
ответов

Ошибка Юникода при выводе вывода скрипта Python в файл

Вот код: print '"' + title.decode ('utf-8', error='ignore') + '",' \ ' "' + title.decode('utf-8', error='ignore') + '", ' \ '"' + desc .decode('utf-8', errors='ignore') + '")' ...
вопрос задан: 4 April 2012 19:51
0
ответов

Зачем перекомпоновывать Unicode (NFC) на выходе?

TomC рекомендует разлагать символы Юникода на входе и перекомпоновывать на выходе (http://www.perl.com/pub/2012/04/perl-unicode-cookbook-always-decompose-and-recompose. html). Первый ...
вопрос задан: 4 April 2012 13:45
0
ответов

Разделение лигатурных символов Unicode

На протяжении огромного количества символов Unicode, есть такие, которые на самом деле представляют более одного символа, например лигатура U + FB00 ff для двух символов 'f'. Есть ли какой-нибудь простой способ преобразовать ...
вопрос задан: 3 April 2012 05:12
0
ответов

Mercurial выдает ошибку «недопустимый шаблон» для простого синтаксиса GLOB

В моем файле .hgignore есть следующее: синтаксис: glob obj / * bin / * * .suo *.Пользователь * .ncb Если я закомментирую файл *. фильтры, фильтрация работает с тонкой фильтрацией файлов в папке bin и obj, ...
вопрос задан: 2 April 2012 21:49
0
ответов

Кросс-платформенный C++: использовать собственную кодировку строк или стандартизировать для разных платформ?

Мы внимательно следим за развитием Windows и Linux и предложили два различных подхода, каждый из которых имеет свои достоинства. Естественным строковым типом Unicode в Windows является UTF-16, и...
вопрос задан: 2 April 2012 09:29
0
ответов

Как конвертировать юникод в JavaScript?

Я использую Google Maps API. См. этот ответ JSON. Инструкции HTML написаны следующим образом :"html _инструкции" :"Поверните \u003cb\u003eleft\u003c/b\u003e на \u003cb\u003eEnggårdsgade\...
вопрос задан: 29 March 2012 20:36
0
ответов

UnicodeEncodeError только при запуске в качестве задания cron [дубликат]

Моя программа работает прямо в командной строке, но когда я запускаю ее как задание cron, происходит сбой из-за ошибки: UnicodeEncodeError: кодек 'ascii' не может кодировать персонаж u'\xa7' в позиции 13: порядковый номер не в ...
вопрос задан: 29 March 2012 19:48
0
ответов

Как проверить и китайское (юникод), и английское имя?

У меня многоязычный веб-сайт ( Китайский и английский). Мне нравится проверять текстовое поле (поле имени) в javascript. Пока у меня есть следующий код. var chkName = / ^ [символы] {1,20} $ /; if (chkName ....
вопрос задан: 29 March 2012 19:02
0
ответов

Как указать диапазон символов Юникода в регулярном выражении на Python? [дубликат]

Я пытаюсь сопоставить диапазон символов Unicode, и мне интересно, как это сделать. Я могу сопоставить простые диапазоны, такие как [a-zA-Z], но как мне указать диапазон символов Unicode. Я пробовал [# xD8- # xF6] ...
вопрос задан: 29 March 2012 19:00
0
ответов

соответствие символов Юникода в регулярных выражениях Python

Я прочитал другие вопросы в Stackoverflow, но все еще не ближе. Извините, если на это уже есть ответ, но я не получил ничего из предложенного для работы. >>> импорт ре >>> ...
вопрос задан: 29 March 2012 18:58
0
ответов

Сопоставление идентификатора Unicode C # с использованием Regex

Каков правильный способ сопоставления идентификатор C #, конкретно имя свойства или поля с использованием шаблонов .Net Regex? Задний план. Раньше я использовал ASCII-ориентированный @ "[_ a-zA-Z] [_ a-zA-Z0-9] *" Но теперь ...
вопрос задан: 29 March 2012 18:52
0
ответов

Соответствующий корпус чувствительные строки Юникода с регулярными выражениями в Python

предположим, что я хочу сопоставить строчную букву, за которой следует заглавная буква, я мог бы сделать что-то вроде Re.compile (R »[AZ] [AZ]») сейчас Я хочу сделать то же самое для строк Unicode, то есть матч ...
вопрос задан: 29 March 2012 18:51
0
ответов

Соответствие (например, ) буква Unicode с регулярными выражениями Java

Здесь, в StackOverflow, есть много вопросов и ответов, в которых предполагается, что «буква» может быть сопоставлена ​​в регулярном выражении с помощью [a-zA-Z]. Однако в Unicode есть намного больше символов, которые большинство людей могло бы ...
вопрос задан: 29 March 2012 18:46
0
ответов

Сканирование номеров Unicode в строке с \ d

Согласно документации Oniguruma, тип символа \ d соответствует: десятичная цифра char Unicode: General_Category - Decimal_Number Однако сканирование для \ d в строке со всеми ...
вопрос задан: 29 March 2012 18:38
0
ответов

Как проверить, какой язык поддерживает уровень поддержки регулярных выражений Юникода?

Различные уровни поддержки регулярных выражений Юникода описаны в UTS#18. Есть ли способ иметь несколько тестов для каждого требования, так что можно перенести тесты на язык в ...
вопрос задан: 29 March 2012 18:26
0
ответов

Unicode эквиваленты для \ w и \ b в регулярных выражениях Java?

Многие современные реализации регулярных выражений интерпретируют сокращение класса символов \ w как «любую букву, цифру или соединительную пунктуацию» (обычно: подчеркивание). Таким образом, регулярное выражение типа \ w + соответствует словам типа ...
вопрос задан: 29 March 2012 18:21
0
ответов

Получение символов Юникода языка в Java

Есть ли какой-либо способ в Java, чтобы я мог получить все символы Юникода символы определенного языка (например, бенгали или арабского)?
вопрос задан: 29 March 2012 18:20
0
ответов

Соответствует ли \ w всем буквенно-цифровым символам, определенным в стандарту Unicode?

Соответствует ли \ w в Perl всем буквенно-цифровым символам, определенным в стандарте Unicode? Например, будет ли \ w соответствовать всем (скажем) китайским и русским буквенно-цифровым символам? Я написал простой тестовый сценарий (см. ...
вопрос задан: 29 March 2012 18:20
0
ответов

разделение слова в Ruby для подсчета

Когда я разделяю строку «hello world / n» на «hello world \ n» .scan (/ \ w + /) Я получаю ["привет", "мир"]. Я также хотел бы считать \ n или \ t строкой.
вопрос задан: 29 March 2012 18:19
0
ответов

Итерация по кодовым точкам Unicode символ за символом

У меня есть серия кодовых точек Unicode. Что мне действительно нужно сделать, так это перебрать эти кодовые точки как серию символов, а не как серию кодовых точек, и определить свойства каждой отдельной ...
вопрос задан: 29 March 2012 18:17
0
ответов

Разделить строку с помощью разделителя Unicode

Мне нужно разделить строку с "-" в качестве разделителя в java. Например: «Одноместный номер - приятного пребывания». У меня есть одни и те же данные на английском и немецком языках в зависимости от региона. Следовательно, я не могу использовать обычный
вопрос задан: 29 March 2012 18:15
0
ответов

Соответствие буквенным символам Unicode в PCRE / PHP

Я пытаюсь написать достаточно разрешающий валидатор для имен в PHP, и моя первая попытка состоит из следующего шаблона: // буквы Unicode, апостроф, дефис, пробел { {1}} $ namePattern = "/ ^ ([\\ p {L} ...
вопрос задан: 29 March 2012 18:13
0
ответов

Что такое категория {L} Unicode?

Я наткнулся на некоторые регулярные выражения, содержащие [^ \\ p {L}]. Я понимаю, что здесь используется некоторая форма категории Unicode, но когда я проверил документацию, я обнаружил только следующую букву «L» ...
вопрос задан: 29 March 2012 18:12
0
ответов

Is There a Way to Match Any Unicode non-Alphabetic Character?

I have some documents that went through OCR conversion from PDF into HTML. Because of that, they wound up having lots of random unicode punctuation where the converter messed up (i.e. elipses, etc...)....
вопрос задан: 29 March 2012 18:02
0
ответов

Список буквенных символов Unicode

I нужен список диапазонов символов Юникода со свойством Alphabetic, как определено в http://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabetic. Однако я не могу найти их в Unicode ...
вопрос задан: 29 March 2012 16:40
0
ответов

Чему соответствует выражение \X внутри RegEx?

Согласно http://www.regular-expressions.info, \X можно считать Unicode-версией точки в механизмах регулярных выражений, использующих простой ASCII. Означает ли это, что он будет соответствовать любому возможному Unicode...
вопрос задан: 29 March 2012 15:25
0
ответов

PyODBC выводит неправильный UTF-16

Я пытаюсь получить список имен таблиц из базы данных MySQL. Соответствующие части кода следующие: :conn = pyodbc.connect('...')курсор = соединение.курсор()для таблицы в cursor.tables():...
вопрос задан: 28 March 2012 16:17
0
ответов

Приведение Django к Unicode: нужна строка или буфер, datetime.date найдено

У меня есть модель: класс MyModel(models.Model): id = models.IntegerField(primary_key=True) record_on = models.DateField() осадки = models.FloatField(null=True, пустое=True) в моем ...
вопрос задан: 28 March 2012 15:40
0
ответов

Как заставить Django создать слаг из символов юникода?

Django Unicode Slug как сделать? class NewsModel(models.Model): title = models.CharField(max_length = 300) slug = models.CharField(max_length = 300) content = models.TextField() def save(...
вопрос задан: 28 March 2012 05:52
0
ответов

Как декодировать encodeURIComponent в GAE (python)?

У меня есть строка юникода, которая была закодирована на стороне клиента с помощью JS encodeURIComponent. Если я использую следующее в Python локально, я получаю ожидаемый результат:>>> urllib.unquote("Foo%E2%84%...
вопрос задан: 26 March 2012 21:30