У меня есть этот текстовый файл, который я прочитал в приложении Java и Затем сосчитайте слова в ней линии по линии. Прямо сейчас я разделяю линии словами на
String.split([\\p{Punct}\\s+])"
, но я знаю, что я пропускаю несколько слов из текстового файла. Например, слово «не может» должно быть разделенным на два слова «банка» и «T».
запятые и другие пунктуации должны быть полностью игнорированы и рассматриваются как пробелы. Я пытался понять, как сформировать более точное регулярное выражение, чтобы сделать это, но я Новичок, когда дело доходит до этого, поэтому мне нужна помощь.
Что может быть лучшего регеляции для этой цели, которую я описал?