Расщепляющиеся строки с помощью регулярных выражений пунктуацией и пробелом и т. Д. В Java

У меня есть этот текстовый файл, который я прочитал в приложении Java и Затем сосчитайте слова в ней линии по линии. Прямо сейчас я разделяю линии словами на

String.split([\\p{Punct}\\s+])"

, но я знаю, что я пропускаю несколько слов из текстового файла. Например, слово «не может» должно быть разделенным на два слова «банка» и «T».

запятые и другие пунктуации должны быть полностью игнорированы и рассматриваются как пробелы. Я пытался понять, как сформировать более точное регулярное выражение, чтобы сделать это, но я Новичок, когда дело доходит до этого, поэтому мне нужна помощь.

Что может быть лучшего регеляции для этой цели, которую я описал?

23
задан stema 12 September 2011 в 08:14
поделиться