Как найти, имеет ли конкретная строка unicode символы (особенно. Двухбайтовые символы)

Что такое NullPointerException?

Хорошим местом для начала является JavaDocs . Они охватывают это:

Брошено, когда приложение пытается использовать null в случае, когда требуется объект. К ним относятся:

  • Вызов метода экземпляра нулевого объекта.
  • Доступ или изменение поля нулевого объекта.
  • Выполнение длины null, как если бы это был массив.
  • Доступ или изменение слотов с нулевым значением, как если бы это был массив.
  • Бросать нуль, как если бы это было значение Throwable.

Приложения должны бросать экземпляры этого класса для указания других незаконных видов использования нулевого объекта.

blockquote>

Также, если вы попытаетесь использовать нулевую ссылку с synchronized, который также выдаст это исключение, за JLS :

SynchronizedStatement:
    synchronized ( Expression ) Block
  • В противном случае, если значение выражения равно null, NullPointerException.
blockquote>

Как это исправить?

Итак, у вас есть NullPointerException. Как вы это исправите? Возьмем простой пример, который выдает NullPointerException:

public class Printer {
    private String name;

    public void setName(String name) {
        this.name = name;
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer();
        printer.print();
    }
}

Идентифицирует нулевые значения

. Первый шаг - точно определить , значения которого вызывают исключение . Для этого нам нужно выполнить некоторую отладку. Важно научиться читать stacktrace . Это покажет вам, где было выбрано исключение:

Exception in thread "main" java.lang.NullPointerException
    at Printer.printString(Printer.java:13)
    at Printer.print(Printer.java:9)
    at Printer.main(Printer.java:19)

Здесь мы видим, что исключение выбрано в строке 13 (в методе printString). Посмотрите на строку и проверьте, какие значения равны нулю, добавив протоколирующие операторы или используя отладчик . Мы обнаруживаем, что s имеет значение null, а вызов метода length на него вызывает исключение. Мы видим, что программа перестает бросать исключение, когда s.length() удаляется из метода.

Трассировка, где эти значения взяты из

Затем проверьте, откуда это значение. Следуя вызовам метода, мы видим, что s передается с printString(name) в методе print(), а this.name - null.

Трассировка, где эти значения должны быть установлены

Где установлен this.name? В методе setName(String). С некоторой дополнительной отладкой мы видим, что этот метод вообще не вызывается. Если этот метод был вызван, обязательно проверьте порядок , что эти методы вызывают, а метод set не будет называться после методом печати. ​​

Этого достаточно, чтобы дать нам решение: добавить вызов printer.setName() перед вызовом printer.print().

Другие исправления

Переменная может иметь значение по умолчанию setName может помешать ему установить значение null):

private String name = "";

Либо метод print, либо printString может проверить значение null например:

printString((name == null) ? "" : name);

Или вы можете создать класс, чтобы name всегда имел ненулевое значение :

public class Printer {
    private final String name;

    public Printer(String name) {
        this.name = Objects.requireNonNull(name);
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer("123");
        printer.print();
    }
}

См. также:

Я все еще не могу найти проблему

Если вы попытались отладить проблему и до сих пор не имеете решения, вы можете отправить вопрос для получения дополнительной справки, но не забудьте включить то, что вы пробовали до сих пор. Как минимум, включите stacktrace в вопрос и отметьте важные номера строк в коде. Также попробуйте сначала упростить код (см. SSCCE ).

26
задан brasofilo 14 October 2014 в 13:42
поделиться

4 ответа

JavaScript содержит текст внутренне как UCS-2, который может закодировать довольно обширное подмножество Unicode.

, Но это не действительно релевантно Вашему вопросу. Одно решение могло бы состоять в том, чтобы циклично выполниться через строку и исследовать коды символов в каждом положении:

function isDoubleByte(str) {
    for (var i = 0, n = str.length; i < n; i++) {
        if (str.charCodeAt( i ) > 255) { return true; }
    }
    return false;
}

Это не могло бы быть то, с такой скоростью, как Вы хотели бы.

27
ответ дан Cheers and hth. - Alf 28 November 2019 в 06:16
поделиться

На самом деле все символы являются Unicode, по крайней мере, с точки зрения механизма JavaScript.

, К сожалению, простого присутствия символов в конкретном Диапазоне Unicode не будет достаточно, чтобы решить необходимость в большем количестве пространства. Существует много символов, которые поднимают примерно ту же сумму пространства как другие символы, которые имеют кодовые точки Unicode много больше диапазона ASCII. Типографские кавычки, символы с диакритическими знаками, определенными символами пунктуации и различными обозначениями денежной единицы за пределами низкого ASCII, располагаются и выделяются в довольно разрозненных местах на Unicode основная многоязычная плоскость.

Обычно проекты, что я продолжил работать, выбирают обеспечивать дополнительное пространство для всех языков, или иногда использовать JavaScript, чтобы определить, имеет ли окно с автополосой прокрутки css атрибуты на самом деле содержание с высотой, которая инициировала бы полосу прокрутки или нет.

При обнаружении присутствия, или количество, символы CJK будут соответствовать, чтобы решить необходимость в небольшом количестве дополнительного пространства Вы могли создать regex использование следующих диапазонов: [\u3300-\u9fff\uf900-\ufaff] и использование, что для извлечения количества количества символов то соответствие. (Это немного чрезмерно крупно, и пропускает все non-BMP случаи, вероятно, исключает некоторые другие соответствующие диапазоны, и скорее всего включает некоторые несоответствующие символы, но это - начальная точка).

Снова, Вы только собираетесь быть способными управлять грубой эвристикой без чего-то вроде полнотекстового механизма визуализации, потому что то, что Вы действительно хотите, является чем-то как MeasureString GDI (или любой другой текстовый эквивалентный механизм визуализации). Это было некоторое время, так как я сделал так, но я думаю, что самый близкий эквивалент HTML/DOM устанавливает ширину на отделении и запрашивает высоту (вырезанное и вставленное повторное использование, таким образом, извинения, если это содержит ошибки):

o = document.getElementById("test");

document.defaultView.getComputedStyle(o,"").getPropertyValue("height"))
6
ответ дан 3 revs, 2 users 91% 28 November 2019 в 06:16
поделиться

Почему бы не позволять окну изменить размеры себя на основе высоты/ширины во время выполнения?

Выполнение что-то вроде этого в Вашем всплывающем окне:

window.resizeTo(document.body.clientWidth, document.body.clientHeight);
0
ответ дан Oli 28 November 2019 в 06:16
поделиться

Я использовал ответ Микесамуэля на этот вопрос. Однако я заметил, что, возможно, из-за этой формы перед u должен быть только один escape-слэш, например \ u , а не \\ u , чтобы эта работа работала. правильно.

function containsNonLatinCodepoints(s) {
    return /[^\u0000-\u00ff]/.test(s);
}

У меня работает :)

36
ответ дан 28 November 2019 в 06:16
поделиться
Другие вопросы по тегам:

Похожие вопросы: