unicode - список вопросов по программированию unicode

0

ответов

Ошибка Юникода при выводе вывода скрипта Python в файл

Вот код: print '"' + title.decode ('utf-8', error='ignore') + '",' \ ' "' + title.decode('utf-8', error='ignore') + '", ' \ '"' + desc .decode('utf-8', errors='ignore') + '")' ...

beautifulsoup python unicode

вопрос задан: 4 April 2012 19:51

0

ответов

Зачем перекомпоновывать Unicode (NFC) на выходе?

TomC рекомендует разлагать символы Юникода на входе и перекомпоновывать на выходе (http://www.perl.com/pub/2012/04/perl-unicode-cookbook-always-decompose-and-recompose. html). Первый ...

perl unicode

вопрос задан: 4 April 2012 13:45

0

ответов

Разделение лигатурных символов Unicode

На протяжении огромного количества символов Unicode, есть такие, которые на самом деле представляют более одного символа, например лигатура U + FB00 ﬀ для двух символов 'f'. Есть ли какой-нибудь простой способ преобразовать ...

java unicode character ascii ligature

вопрос задан: 3 April 2012 05:12

0

ответов

Mercurial выдает ошибку «недопустимый шаблон» для простого синтаксиса GLOB

В моем файле .hgignore есть следующее: синтаксис: glob obj / * bin / * * .suo *.Пользователь * .ncb Если я закомментирую файл *. фильтры, фильтрация работает с тонкой фильтрацией файлов в папке bin и obj, ...

regex version-control unicode mercurial hgignore

вопрос задан: 2 April 2012 21:49

0

ответов

Кросс-платформенный C++: использовать собственную кодировку строк или стандартизировать для разных платформ?

Мы внимательно следим за развитием Windows и Linux и предложили два различных подхода, каждый из которых имеет свои достоинства. Естественным строковым типом Unicode в Windows является UTF-16, и...

cross-platform unicode windows c++ linux

вопрос задан: 2 April 2012 09:29

0

ответов

Как конвертировать юникод в JavaScript?

Я использую Google Maps API. См. этот ответ JSON. Инструкции HTML написаны следующим образом :"html _инструкции" :"Поверните \u003cb\u003eleft\u003c/b\u003e на \u003cb\u003eEnggårdsgade\...

google-maps-api-3 javascript unicode

вопрос задан: 29 March 2012 20:36

0

ответов

UnicodeEncodeError только при запуске в качестве задания cron [дубликат]

Моя программа работает прямо в командной строке, но когда я запускаю ее как задание cron, происходит сбой из-за ошибки: UnicodeEncodeError: кодек 'ascii' не может кодировать персонаж u'\xa7' в позиции 13: порядковый номер не в ...

cron python unicode

вопрос задан: 29 March 2012 19:48

0

ответов

Как проверить и китайское (юникод), и английское имя?

У меня многоязычный веб-сайт ( Китайский и английский). Мне нравится проверять текстовое поле (поле имени) в javascript. Пока у меня есть следующий код. var chkName = / ^ [символы] {1,20} $ /; if (chkName ....

javascript regex unicode character-properties

вопрос задан: 29 March 2012 19:02

0

ответов

Как указать диапазон символов Юникода в регулярном выражении на Python? [дубликат]

Я пытаюсь сопоставить диапазон символов Unicode, и мне интересно, как это сделать. Я могу сопоставить простые диапазоны, такие как [a-zA-Z], но как мне указать диапазон символов Unicode. Я пробовал [# xD8- # xF6] ...

python regex unicode

вопрос задан: 29 March 2012 19:00

0

ответов

соответствие символов Юникода в регулярных выражениях Python

Я прочитал другие вопросы в Stackoverflow, но все еще не ближе. Извините, если на это уже есть ответ, но я не получил ничего из предложенного для работы. >>> импорт ре >>> ...

python regex unicode non-ascii-characters character-properties

вопрос задан: 29 March 2012 18:58

0

ответов

Сопоставление идентификатора Unicode C # с использованием Regex

Каков правильный способ сопоставления идентификатор C #, конкретно имя свойства или поля с использованием шаблонов .Net Regex? Задний план. Раньше я использовал ASCII-ориентированный @ "[_ a-zA-Z] [_ a-zA-Z0-9] *" Но теперь ...

c# regex unicode character-properties

вопрос задан: 29 March 2012 18:52

0

ответов

Соответствующий корпус чувствительные строки Юникода с регулярными выражениями в Python

предположим, что я хочу сопоставить строчную букву, за которой следует заглавная буква, я мог бы сделать что-то вроде Re.compile (R »[AZ] [AZ]») сейчас Я хочу сделать то же самое для строк Unicode, то есть матч ...

python regex unicode case-insensitive character-properties

вопрос задан: 29 March 2012 18:51

0

ответов

Соответствие (например, ) буква Unicode с регулярными выражениями Java

Здесь, в StackOverflow, есть много вопросов и ответов, в которых предполагается, что «буква» может быть сопоставлена в регулярном выражении с помощью [a-zA-Z]. Однако в Unicode есть намного больше символов, которые большинство людей могло бы ...

java regex unicode character-properties character-class

вопрос задан: 29 March 2012 18:46

0

ответов

Сканирование номеров Unicode в строке с \ d

Согласно документации Oniguruma, тип символа \ d соответствует: десятичная цифра char Unicode: General_Category - Decimal_Number Однако сканирование для \ d в строке со всеми ...

ruby regex unicode character-properties

вопрос задан: 29 March 2012 18:38

0

ответов

Как проверить, какой язык поддерживает уровень поддержки регулярных выражений Юникода?

Различные уровни поддержки регулярных выражений Юникода описаны в UTS#18. Есть ли способ иметь несколько тестов для каждого требования, так что можно перенести тесты на язык в ...

regex string language-agnostic unicode character-properties

вопрос задан: 29 March 2012 18:26

0

ответов

Unicode эквиваленты для \ w и \ b в регулярных выражениях Java?

Многие современные реализации регулярных выражений интерпретируют сокращение класса символов \ w как «любую букву, цифру или соединительную пунктуацию» (обычно: подчеркивание). Таким образом, регулярное выражение типа \ w + соответствует словам типа ...

character-properties unicode regex java

вопрос задан: 29 March 2012 18:21

0

ответов

Получение символов Юникода языка в Java

Есть ли какой-либо способ в Java, чтобы я мог получить все символы Юникода символы определенного языка (например, бенгали или арабского)?

java unicode character-properties

вопрос задан: 29 March 2012 18:20

0

ответов

Соответствует ли \ w всем буквенно-цифровым символам, определенным в стандарту Unicode?

Соответствует ли \ w в Perl всем буквенно-цифровым символам, определенным в стандарте Unicode? Например, будет ли \ w соответствовать всем (скажем) китайским и русским буквенно-цифровым символам? Я написал простой тестовый сценарий (см. ...

regex perl unicode internationalization character-properties

вопрос задан: 29 March 2012 18:20

0

ответов

разделение слова в Ruby для подсчета

Когда я разделяю строку «hello world / n» на «hello world \ n» .scan (/ \ w + /) Я получаю ["привет", "мир"]. Я также хотел бы считать \ n или \ t строкой.

javascript regex unicode split

вопрос задан: 29 March 2012 18:19

0

ответов

Итерация по кодовым точкам Unicode символ за символом

У меня есть серия кодовых точек Unicode. Что мне действительно нужно сделать, так это перебрать эти кодовые точки как серию символов, а не как серию кодовых точек, и определить свойства каждой отдельной ...

c++ unicode character-properties

вопрос задан: 29 March 2012 18:17

0

ответов

Разделить строку с помощью разделителя Unicode

Мне нужно разделить строку с "-" в качестве разделителя в java. Например: «Одноместный номер - приятного пребывания». У меня есть одни и те же данные на английском и немецком языках в зависимости от региона. Следовательно, я не могу использовать обычный

java string unicode character-properties

вопрос задан: 29 March 2012 18:15

0

ответов

Соответствие буквенным символам Unicode в PCRE / PHP

Я пытаюсь написать достаточно разрешающий валидатор для имен в PHP, и моя первая попытка состоит из следующего шаблона: // буквы Unicode, апостроф, дефис, пробел { {1}} $ namePattern = "/ ^ ([\\ p {L} ...

php regex unicode pcre character-properties

вопрос задан: 29 March 2012 18:13

0

ответов

Что такое категория {L} Unicode?

Я наткнулся на некоторые регулярные выражения, содержащие [^ \\ p {L}]. Я понимаю, что здесь используется некоторая форма категории Unicode, но когда я проверил документацию, я обнаружил только следующую букву «L» ...

java regex unicode character-properties

вопрос задан: 29 March 2012 18:12

0

ответов

Is There a Way to Match Any Unicode non-Alphabetic Character?

I have some documents that went through OCR conversion from PDF into HTML. Because of that, they wound up having lots of random unicode punctuation where the converter messed up (i.e. elipses, etc...)....

regex perl unicode character-properties

вопрос задан: 29 March 2012 18:02

0

ответов

Список буквенных символов Unicode

I нужен список диапазонов символов Юникода со свойством Alphabetic, как определено в http://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabetic. Однако я не могу найти их в Unicode ...

unicode alphabetic character-properties

вопрос задан: 29 March 2012 16:40

0

ответов

Чему соответствует выражение \X внутри RegEx?

Согласно http://www.regular-expressions.info, \X можно считать Unicode-версией точки в механизмах регулярных выражений, использующих простой ASCII. Означает ли это, что он будет соответствовать любому возможному Unicode...

unicode regex

вопрос задан: 29 March 2012 15:25

0

ответов

PyODBC выводит неправильный UTF-16

Я пытаюсь получить список имен таблиц из базы данных MySQL. Соответствующие части кода следующие: :conn = pyodbc.connect('...')курсор = соединение.курсор()для таблицы в cursor.tables():...

mysql pyodbc python unicode

вопрос задан: 28 March 2012 16:17

0

ответов

Приведение Django к Unicode: нужна строка или буфер, datetime.date найдено

У меня есть модель: класс MyModel(models.Model): id = models.IntegerField(primary_key=True) record_on = models.DateField() осадки = models.FloatField(null=True, пустое=True) в моем ...

datetime django unicode

вопрос задан: 28 March 2012 15:40

0

ответов

Как заставить Django создать слаг из символов юникода?

Django Unicode Slug как сделать? class NewsModel(models.Model): title = models.CharField(max_length = 300) slug = models.CharField(max_length = 300) content = models.TextField() def save(...

django slug unicode

вопрос задан: 28 March 2012 05:52

0

ответов

Как декодировать encodeURIComponent в GAE (python)?

У меня есть строка юникода, которая была закодирована на стороне клиента с помощью JS encodeURIComponent. Если я использую следующее в Python локально, я получаю ожидаемый результат:>>> urllib.unquote("Foo%E2%84%...

character-encoding google-app-engine python unicode uri

вопрос задан: 26 March 2012 21:30