RegEx для всех букв (включая китайский язык, греческий язык, и т.д.)

Мне нужен regex, который также соответствует китайскому языку, греческому языку, русскому языку... обозначает буквами. То, что я в основном хочу сделать, удаляют пунктуацию и числа.

До сих пор я удалил пунктуацию и числа "вручную", но это, кажется, не очень последовательно.

Другая вещь, которую я попробовал,

/[\p{L}]/

но это не поддерживается Mozilla (я использую это в расширении Firefox).

7
задан slosd 5 July 2009 в 08:30
поделиться

2 ответа

Пробовали ли вы XRegExp и плагин Unicode ?

<script src="xregexp.js"></script>
<script src="xregexp-unicode.js"></script>
<script>
    var unicodeWord = XRegExp("^\\p{L}+$");
    alert(unicodeWord.test("Ниндзя")); // -> true
</script>
4
ответ дан 7 December 2019 в 12:24
поделиться

Вы можете найти множество жалоб на текущие спецификации ECMA для регулярных выражений, которые не работают с символами Юникода должным образом. Например, запись в блоге Скотта Хансельмана , которая ссылается на вопрос SO; -)
«Настоящего» решения этой проблемы пока нет, но взгляните на ответы Javascript + Unicode regexes (ваш вопрос более или менее дублирует этот) (правка: я беру это обратно, Плагин юникода, который предлагает Джонатан Лоновски, выглядит довольно красиво)

1
ответ дан 7 December 2019 в 12:24
поделиться
Другие вопросы по тегам:

Похожие вопросы: