Разделение текста на предложения и предложения на слова: BreakIterator vs регулярные выражения

Я случайно ответил на вопрос , где исходная проблема заключалась в разделении предложения на отдельные слова.

И автор предложил использовать BreakIterator для токенизации входных строк, и некоторым людям понравилась эта идея.

Я просто не понимаю этого безумия: как 25 строк сложного кода могут быть лучше, чем простой однострочник с регулярным выражением?

Пожалуйста, объясните мне плюсы использования BreakIterator и реальные случаи, когда его следует использовать.

Если это действительно так круто и правильно, то мне интересно: действительно ли вы используете подход с BreakIterator в своих проектах?

6
задан Community 23 May 2017 в 11:47
поделиться