Например, я извлекаю текстовую строку из текстового файла, и мне нужны те слова для формирования массива. Однако, когда я делаю все, что некоторые слова заканчивают запятой или точкой (.) или даже присоединили скобки к ним (который все совершенно нормален).
То, что я хочу сделать, должно избавиться от тех символов. Я пытался сделать то использование тех методов предопределенной строки в Java, но я просто не могу обойти его.
Использование:
String str = "whatever";
str = str.replaceAll("[,.]", "");
replaceAll принимает регулярное выражение . Это:
[,.]
...ищет каждую запятую и/или период.
.Обратите внимание, что границы слов также зависят от Локала. Думаю, лучше всего это сделать с помощью стандартного java.text.BreakIterator. Вот пример из учебника java.sun.com.
import java.text.BreakIterator;
import java.util.Locale;
public static void main(String[] args) {
String text = "\n" +
"\n" +
"For example I'm extracting a text String from a text file and I need those words to form an array. However, when I do all that some words end with comma (,) or a full stop (.) or even have brackets attached to them (which is all perfectly normal).\n" +
"\n" +
"What I want to do is to get rid of those characters. I've been trying to do that using those predefined String methods in Java but I just can't get around it.\n" +
"\n" +
"Every help appreciated. Thanx";
BreakIterator wordIterator = BreakIterator.getWordInstance(Locale.getDefault());
extractWords(text, wordIterator);
}
static void extractWords(String target, BreakIterator wordIterator) {
wordIterator.setText(target);
int start = wordIterator.first();
int end = wordIterator.next();
while (end != BreakIterator.DONE) {
String word = target.substring(start, end);
if (Character.isLetterOrDigit(word.charAt(0))) {
System.out.println(word);
}
start = end;
end = wordIterator.next();
}
}
Source: http://java.sun.com/docs/books/tutorial/i18n/text/word.html
Можно использовать метод replaceAll()
:
String.replaceAll(",", "");
String.replaceAll("\\.", "");
String.replaceAll("\\(", "");
и т.д..
.Для удаления последнего символа сделать так, как Mark Byers сказал
s = s.substring(0, s.length() - 1);
Кроме того, другим способом удаления символов, которые вы не хотите, будет использование метода .replace(oldCharacter, newCharacter)
.
как в:
s = s.replace(",","");
и
s = s.replace(".","");
Переименование переменной в подстроку:
s = s.substring(0, s.length() - 1)
Также альтернативный способ решения проблемы: вы можете также подумать об использовании StringTokenizer для чтения файла и установки разделителей в качестве символов, которые не должны быть частью слов.
.В Java нельзя модифицировать строку. Они неизменны. Все, что можно сделать - это создать новую строку, которая является подстрокой старой строки, минус последний символ.
В некоторых случаях вместо этого может помочь StringBuffer.
.