Преобразование без знака в C - всегда ли это безопасно?

Что такое NullPointerException?

Хорошим местом для начала является JavaDocs . Они охватывают это:

Брошено, когда приложение пытается использовать null в случае, когда требуется объект. К ним относятся:

  • Вызов метода экземпляра нулевого объекта.
  • Доступ или изменение поля нулевого объекта.
  • Выполнение длины null, как если бы это был массив.
  • Доступ или изменение слотов с нулевым значением, как если бы это был массив.
  • Бросать нуль, как если бы это было значение Throwable.

Приложения должны бросать экземпляры этого класса для указания других незаконных видов использования нулевого объекта.

blockquote>

Также, если вы попытаетесь использовать нулевую ссылку с synchronized, который также выдаст это исключение, за JLS :

SynchronizedStatement:
    synchronized ( Expression ) Block
  • В противном случае, если значение выражения равно null, NullPointerException.
blockquote>

Как это исправить?

Итак, у вас есть NullPointerException. Как вы это исправите? Возьмем простой пример, который выдает NullPointerException:

public class Printer {
    private String name;

    public void setName(String name) {
        this.name = name;
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer();
        printer.print();
    }
}

Идентифицирует нулевые значения

. Первый шаг - точно определить , значения которого вызывают исключение . Для этого нам нужно выполнить некоторую отладку. Важно научиться читать stacktrace . Это покажет вам, где было выбрано исключение:

Exception in thread "main" java.lang.NullPointerException
    at Printer.printString(Printer.java:13)
    at Printer.print(Printer.java:9)
    at Printer.main(Printer.java:19)

Здесь мы видим, что исключение выбрано в строке 13 (в методе printString). Посмотрите на строку и проверьте, какие значения равны нулю, добавив протоколирующие операторы или используя отладчик . Мы обнаруживаем, что s имеет значение null, а вызов метода length на него вызывает исключение. Мы видим, что программа прекращает бросать исключение, когда s.length() удаляется из метода.

Трассировка, где эти значения взяты из

Затем проверьте, откуда это значение. Следуя вызовам метода, мы видим, что s передается с printString(name) в методе print(), а this.name - null.

Трассировка, где эти значения должны быть установлены

Где установлен this.name? В методе setName(String). С некоторой дополнительной отладкой мы видим, что этот метод вообще не вызывается. Если этот метод был вызван, обязательно проверьте порядок , что эти методы вызывают, а метод set не будет называться после методом печати. ​​

Этого достаточно, чтобы дать нам решение: добавить вызов printer.setName() перед вызовом printer.print().

Другие исправления

Переменная может иметь значение по умолчанию setName может помешать ему установить значение null):

private String name = "";

Либо метод print, либо printString может проверить значение null например:

printString((name == null) ? "" : name);

Или вы можете создать класс, чтобы name всегда имел ненулевое значение :

public class Printer {
    private final String name;

    public Printer(String name) {
        this.name = Objects.requireNonNull(name);
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer("123");
        printer.print();
    }
}

См. также:

Я все еще не могу найти проблему

Если вы попытались отладить проблему и до сих пор не имеете решения, вы можете отправить вопрос для получения дополнительной справки, но не забудьте включить то, что вы пробовали до сих пор. Как минимум, включите stacktrace в вопрос и отметьте важные номера строк в коде. Также попробуйте сначала упростить код (см. SSCCE ).

126
задан Peter Mortensen 7 February 2012 в 20:28
поделиться

7 ответов

Короткий ответ

Ваш i будет преобразован в целое число без знака путем добавления UINT_MAX + 1, затем дополнение будет выполнено с неподписанными значениями, приводящими к большому result (в зависимости от значений u и i).

Длинный ответ

Согласно стандарту C99:

6.3.1.8 Обычные арифметические преобразования

  1. Если оба операнда имеют тот же тип, то никакое дальнейшее преобразование не необходимо.
  2. Иначе, если оба операнда имеют типы целого числа со знаком, или у обоих есть типы беззнаковых целых чисел, операнд с типом меньшего целочисленного разряда преобразования преобразовывается в тип операнда с большим разрядом.
  3. Иначе, если операнд, который имеет тип беззнаковых целых чисел, имеет разряд, больше или равный разряду типа другого операнда, затем операнд с типом целого числа со знаком преобразовывается в тип операнда с типом беззнаковых целых чисел.
  4. Иначе, если тип операнда с типом целого числа со знаком может представить все значения типа операнда с типом беззнаковых целых чисел, то операнд с типом беззнаковых целых чисел преобразовывается в тип операнда с типом целого числа со знаком.
  5. Иначе оба операнда преобразовываются в тип беззнаковых целых чисел, соответствующий типу операнда с типом целого числа со знаком.

В Вашем случае у нас есть один неподписанный интервал (u) и подписанный интервал (i). Что касается (3) выше, так как оба операнда имеют тот же разряд, Ваш i должен будет быть преобразован в целое число без знака.

6.3.1.3 Целые числа со знаком и целые числа без знака

  1. Когда значение с целым типом преобразовывается в другой целый тип кроме _Bool, если значение может быть представлено новым типом, это неизменно.
  2. Иначе, если новый тип не подписан, значение преобразовывается путем повторного добавления или вычитания еще одного, чем максимальное значение, которое может быть представлено в новом типе, пока значение не находится в диапазоне нового типа.
  3. Иначе новый тип подписывается, и значение не может быть представлено в нем; или результат определяется реализацией или определенный реализацией сигнал, повышен.

Теперь мы должны обратиться к (2) выше. Ваш i будет преобразован в неподписанное значение путем добавления UINT_MAX + 1. Таким образом, результат будет зависеть от как UINT_MAX определяется на Вашей реализации. Это будет большим, но это не переполнится, потому что:

6.2.5 (9)

Вычисление, включающее неподписанные операнды, никогда не может переполняться, потому что результат, который не может быть представлен получающимся типом беззнаковых целых чисел, уменьшается по модулю число, которое является одним большим, чем самое большое значение, которое может быть представлено получающимся типом.

Премия: арифметическое преобразование Semi-WTF

#include <stdio.h>

int main(void)
{
  unsigned int plus_one = 1;
  int minus_one = -1;

  if(plus_one < minus_one)
    printf("1 < -1");
  else
    printf("boring");

  return 0;
}

Можно использовать эту ссылку для попытки этого онлайн: https://repl.it/repls/QuickWhimsicalBytes

Премия: арифметический побочный эффект преобразования

Арифметические правила преобразования могут использоваться для получения значения UINT_MAX путем инициализации неподписанного значения к -1, т.е.:

unsigned int umax = -1; // umax set to UINT_MAX

Это, как гарантируют, будет портативно независимо от представления числа со знаком системы из-за правил преобразования, описанных выше. Посмотрите это ТАК вопрос для получения дополнительной информации: действительно ли безопасно использовать-1 для установки всех битов на истинный?

208
ответ дан 24 November 2019 в 00:53
поделиться

Что касается библии:

  • Ваша операция сложения заставляет интервал быть преобразованным в неподписанный интервал.
  • Принимая дополнительное представление two и одинаково измеренные типы, комбинация двоичных разрядов не изменяется.
  • Преобразование от неподписанного интервала до интервала со знаком является зависящим от реализации. (Но это, вероятно, работает способ, которым Вы ожидаете на большинстве платформ в эти дни.)
  • Правила немного более сложны в случае объединения, со знаком и неподписанного из отличающихся размеров.
4
ответ дан 24 November 2019 в 00:53
поделиться

Когда одно неподписанное и одна переменная со знаком добавляются (или любая бинарная операция), оба неявно преобразовываются в неподписанный, который был бы в этом результате случая в огромном результате.

Таким образом, это безопасно в смысле этого, результат мог бы быть огромным и неправильным, но это никогда не будет отказывать.

3
ответ дан 24 November 2019 в 00:53
поделиться

При преобразовании от со знаком до неподписанного существует две возможности. Числа, которые были первоначально положительны, остаются (или интерпретируются как), то же значение. Число, которые были первоначально отрицательны, будет теперь интерпретироваться как большие положительные числа.

3
ответ дан 24 November 2019 в 00:53
поделиться

Как был ранее отвечен, можно вспомнить и дальше между со знаком и неподписанным без проблемы. Случай границы для целых чисел со знаком-1 (0xFFFFFFFF). Попытайтесь добавить и вычесть из этого, и Вы найдете, что можно бросить и иметь его быть корректными.

Однако, если бы Вы собираетесь быть вспоминающими и дальше, я настоятельно рекомендовал бы называть Ваши переменные таким образом, что ясно, что вводит, они, например:

int iValue, iResult;
unsigned int uValue, uResult;

Слишком легко быть отвлеченным более важными проблемами и забыть, какая переменная - то, какой тип, если их называют без подсказки. Вы не хотите бросать к неподписанному и затем использовать это в качестве индекса массива.

1
ответ дан 24 November 2019 в 00:53
поделиться

Преобразование из подписанного в беззнаковый не обязательно просто копирует или переинтерпретирует представление значение со знаком. Цитата из стандарта C (C99 6.3.1.3):

Когда значение с целочисленным типом преобразуется в другой целочисленный тип, отличный от _Bool, если значение может быть представлено новым типом, оно не изменяется.

В противном случае, если новый тип беззнаковый, значение преобразуется путем многократного добавления или вычитание на единицу больше максимального значения, которое может быть представлено в новом типе пока значение не окажется в диапазоне нового типа.

В противном случае новый тип подписывается и значение не может быть представлено в нем; либо результат определяется реализацией или возникает сигнал, определенный реализацией.

Для представления дополнения до двух, которое в наши дни почти универсально, правила действительно соответствуют переинтерпретации битов. Но для других представлений (знак и величина или дополнение до единиц) реализация C должна по-прежнему обеспечивать тот же результат, что означает, что преобразование не может просто копировать биты. Например, (беззнаковый) -1 == UINT_MAX, независимо от представления.

В общем, преобразования в C определены для работы со значениями, а не с представлениями.

Чтобы ответить на исходный вопрос:

unsigned int u = 1234;
int i = -5678;

unsigned int result = u + i;

значение i преобразуется в целое число без знака, давая UINT_MAX + 1 - 5678 . Затем это значение добавляется к беззнаковому значению 1234, получая UINT_MAX + 1 - 4444 .

(В отличие от переполнения без знака, подписанное переполнение вызывает неопределенное поведение. Обертывание является обычным явлением, но не гарантируется стандартом C - и оптимизация компилятора может нанести ущерб коду, который делает необоснованные предположения.)

21
ответ дан 24 November 2019 в 00:53
поделиться

Ужасные ответы в изобилии

Озгур Озчитак

Когда вы переходите от подписанного к неподписанному (и наоборот) внутренняя представление числа не изменение. Что меняется, так это то, как компилятор интерпретирует знаковый бит.

Это совершенно неверно.

Матс Фредрикссон

Когда один беззнаковый и один подписанный добавляются переменные (или любые двоичные операция) оба неявно преобразован в беззнаковый, что в в этом случае результат огромен.

Это тоже неверно.Беззнаковые целые числа могут быть повышены до целых чисел, если они имеют одинаковую точность из-за битов заполнения в беззнаковом типе.

smh

Ваша операция сложения вызывает int для преобразования в беззнаковое целое.

Неправильно. Может быть, есть, а может, и нет.

Преобразование беззнакового int в подписанное int зависит от реализации. (Но это, вероятно, работает так, как вы ожидаете на большинстве платформ в наши дни.)

Неправильно. Это либо неопределенное поведение, если оно вызывает переполнение, либо значение сохраняется.

Анонимный

Значение i преобразуется в unsigned int ...

Неверно. Зависит от точности int относительно беззнакового int.

Тейлор Прайс

Как уже было сказано ранее, вы можете бросать вперед и назад между подписанным и без подписи без проблем.

Неправильно. Попытка сохранить значение вне диапазона целого числа со знаком приводит к неопределенному поведению.

Теперь я наконец могу ответить на вопрос.

Если точность int будет равна unsigned int, u будет преобразовано в int со знаком, и вы получите значение -4444 из выражения (u + i). Теперь, если у и у меня есть другие значения, вы можете получить поведение переполнения и неопределенности, но с этими точными числами вы получите -4444 [1]. Это значение будет иметь тип int. Но вы пытаетесь сохранить это значение в беззнаковом int, чтобы оно затем было преобразовано в беззнаковое int, а значение, которое в конечном итоге будет иметь, будет (UINT_MAX + 1) - 4444.

Если точность unsigned int больше, чем int, подписанное int будет преобразовано в unsigned int, что даст значение (UINT_MAX + 1) - 5678, которое будет добавлено к другому unsigned int 1234. Если u и у меня есть другие значения, из-за которых выражение выходит за пределы диапазона {0..UINT_MAX}, значение (UINT_MAX + 1) будет либо добавляться, либо вычитаться до тех пор, пока результат НЕ попадет в диапазон {0..UINT_MAX) и не будет неопределенным поведение будет происходить.

Что такое точность?

Целые числа имеют биты заполнения, биты знака и биты значения. Беззнаковые целые числа, очевидно, не имеют знакового бита. Кроме того, гарантируется, что беззнаковый символ не имеет битов заполнения. Число битов значений целого числа определяет степень его точности.

[Попутно]

Макрос размер одного макроса не может использоваться для определения точности целого числа, если присутствуют биты заполнения. И размер байта не обязательно должен быть октетом (восемь бит), как определено C99.

[1] Переполнение может произойти в одной из двух точек. Либо до добавления (во время продвижения) - когда у вас есть неподписанное int, которое слишком велико, чтобы поместиться внутри int. Переполнение может также произойти после добавления, даже если беззнаковое int находилось в диапазоне int, после добавления результат может все еще переполниться.

-17
ответ дан 24 November 2019 в 00:53
поделиться
Другие вопросы по тегам:

Похожие вопросы: