Существуют ли наборы символов для всех международных точек препинания?

Я пытаюсь разобрать строки utf-8 на сегменты "размера укуса". Например, я хотел бы разбить текст на «предложения».

Существует ли полный набор символов (или регулярных выражений), соответствующих концу предложений во всех языках? Я ищу что-то, что зафиксировало бы латинскую точку, восклицательный и вопросительный знаки, китайскую и японскую точку и т. д.

Что-то вроде приведенного выше, но для эквивалента запятой тоже было бы здорово.

7
задан hippietrail 6 May 2013 в 22:14
поделиться