Поиск строки Java без учета акцентов

  val jobName = "WordCount";
  //overwrite the output directory in spark  set("spark.hadoop.validateOutputSpecs", "false")
  val conf = new 
  SparkConf().setAppName(jobName).set("spark.hadoop.validateOutputSpecs", "false");
  val sc = new SparkContext(conf)
32
задан DaveJohnston 7 March 2010 в 20:20
поделиться

1 ответ

Воспользуйтесь java.text.Normalizer и регексом, чтобы избавиться от диакритических знаков.

public static String removeDiacriticalMarks(String string) {
    return Normalizer.normalize(string, Form.NFD)
        .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}

Которые вы можете использовать следующим образом:

String value = "Joáo";
String comparisonMaterial = removeDiacriticalMarks(value); // Joao
83
ответ дан 27 November 2019 в 20:04
поделиться
Другие вопросы по тегам:

Похожие вопросы: