Regex и unicode

У вас есть жесткий код выходного каталога в исходном коде.

Там всегда могут быть такие проблемы, как сервер не является средой Windows, или папка «C: / REPORTS_FOLDER» отсутствует в server.

Было бы лучше иметь его как настраиваемое свойство.

23
задан tchrist 29 March 2012 в 18:10
поделиться

3 ответа

Используйте поддиапазон [\u0000-\uFFFF] для того, что Вы хотите.

можно также использовать re.UNICODE флаг компиляции. в документах говорится, что, если UNICODE установлен, \w, будет соответствовать символам [0-9_] плюс то, что классифицировано как алфавитно-цифровое в базе данных свойств символа Unicode.

См. также http://coding.derkeiler.com/Archive/Python/comp.lang.python/2004-05/2560.html .

16
ответ дан Azat Ibrakov 29 November 2019 в 02:49
поделиться

В Освоении Регулярных выражений от Jeffrey Friedl (замечательная книга) упоминается, что Вы могли использовать \p {Буква}, которая будет соответствовать материалу unicode, который считают буквой.

4
ответ дан Peter Stuifzand 29 November 2019 в 02:49
поделиться

\X, кажется, доступен как универсальный словесный символ на некоторых языках, он позволяет Вам соответствовать односимвольному игнорированию того, сколько байтов он поднимает. Могло бы быть полезным.

0
ответ дан grapefrukt 29 November 2019 в 02:49
поделиться
Другие вопросы по тегам:

Похожие вопросы: