Я создаю CMS для научного журнала, и это использует много греческих символов. Я должен проверить поле для включения определенного набора символов и греческих символов. Вот то, что я имею теперь:
[^a-zA-Z0-9-()/\s]
Как я заставляю это включать греческие символы в дополнение к алфавитно-цифровому, '(', ')', '-', и' _ '?
Я использую C#, между прочим.
На языках .NET можно использовать \ p {IsGreekandCoptic}
для соответствия греческим символам. Таким образом, результирующее регулярное выражение будет
[^a-zA-Z0-9-()/\s\p{IsGreekandCoptic}]
\ p {IsGreekandCoptic}
совпадений:
Для Java, из шаблона javadoc:
\ p {InGreek} Символ в греческом блоке (простой блок)
Если вы используете язык, который использует PCRE для регулярных выражений и UTF-8, / [\ x {0374} - \ x {03FF}] + / u
должны соответствовать греческим символам. Греческие символы находятся между U + 0374 и U + 03FF ( источник ), а модификатор u
указывает PCRE использовать Unicode. Как прокомментировано ниже, / \ p {Greek} + / u
также работает с PCRE.
Если вы используете Javascript, он использует \ uXXXX
вместо \ x {XXXX}
: / [\ u0374- \ u03FF] + /
.
Также см. Это руководство по Регулярные выражения Unicode для получения дополнительной информации.