Java: как проверить, принадлежит ли символ определенному unicode блоку?

15
задан james.garriss 26 December 2015 в 14:02
поделиться

3 ответа

Да, можно просто использовать Символ. UnicodeBlock.of (символ)

18
ответ дан 1 December 2019 в 02:47
поделиться

Если [A-Za-z]+ отвечает Вашему требованию, Вы не собираетесь находить что-либо быстрее или более симпатичным. Однако, если Вы хотите соответствовать всем буквам в блоке Latin1 (включая буквы с диакритическим знаком и лигатуры), можно использовать это:

Pattern p = Pattern.compile("[\\pL&&\\p{L1}]+");

Это - пересечение набора всех букв Unicode и набора всех символов Latin1.

5
ответ дан 1 December 2019 в 02:47
поделиться

У Вас есть противоположная проблема к этот , но иронически что не работает на него, она просто должна работать отлично для Вас. Это должно просто искать слова на английском языке (только ASCII совместимые символы) с reg-exp "\w".

0
ответ дан 1 December 2019 в 02:47
поделиться
Другие вопросы по тегам:

Похожие вопросы: