regex нечувствительность к регистру медленнее?

Question

regex нечувствительность к регистру медленнее?

1) Вам нужно создать пользовательские JsonDeserializer, а не JsonSerializer, как в вашем вопросе.

2) Я не думаю, что это поведение происходит из Double десериализатора. это больше похоже на проблему json object / map

. Из исходного кода :

case NUMBER:
      return in.nextDouble();

Итак, вы можете попробовать подход с настраиваемым десериализатором для Map (или, если хотите, какую-нибудь более общую карту):

public static class MapDeserializerDoubleAsIntFix implements JsonDeserializer>{

    @Override  @SuppressWarnings("unchecked")
    public Map deserialize(JsonElement json, Type typeOfT, JsonDeserializationContext context) throws JsonParseException {
        return (Map) read(json);
    }

    public Object read(JsonElement in) {

        if(in.isJsonArray()){
            List

score 17 · Accepted Answer

Да, [A-Za-z] будет намного быстрее, чем установка эти RegexOptions.IgnoreCase, в основном из-за строк Unicode. Но это также намного больше ограничивает - [A-Za-z], делает не , соответствие акцентировало международные символы, это - буквально набор ASCII A-Za-z и ничто больше.

я не знаю, видели ли Вы ответ Tim Bray на мое сообщение, но это - хорошее:

Одной из самых хитрых проблем в интернационализировавшем поиске является верхний регистр и нижний регистр. Это понятие случая ограничено языками, записанными на латинском, греческом и наборах символа кириллицы. Носители английского языка естественно ожидают, что поиск будет нечувствителен к регистру если только потому, что theyвЂ™re ленивый: если Nadia Jones хочет искать себя на Google sheвЂ™ll, вероятно, просто вводят в nadia Джонсе и ожидают, что система будет заботиться о нем.

Так itвЂ™s довольно характерный для поисковых систем к вЂњnormalizeвЂќ словам путем преобразования их всех для понижения - или верхний регистр, и для индексации и для запросов.

проблема состоит в том, что отображение между случаями не всегда так же просто, как это находится на английском языке. Например, немецкий символ нижнего регистра вЂњГџвЂќ становится вЂњSSвЂќ, когда верхний в корпусе и старым добрым капиталом, вЂњIвЂќ, когда вниз в корпусе на турецком языке становится вЂњД±вЂќ без точки (да, у них есть вЂњiвЂќ, его прописная версия является вЂњД°вЂќ). Я считал (но не проверил непосредственно), что правила для upcasing символов с диакритикой такой вЂњГ©вЂќ отличаются во Франции и QuГ©bec. Один из результатов всего этого то, что программное обеспечение, такое как Java. String.toLowerCase () имеет тенденцию работать удивительно медленный, поскольку он пытается работать вокруг всех этих угловых случаев.

http://www.tbray.org/ongoing/When/200x/2003/10/11/SearchI18n

regex нечувствительность к регистру медленнее?

3 ответа

Похожие вопросы: