Использует ли -опцию -быстрая -математика для преобразования умножения SP во внутренние числа?

Я бегло просмотрел руководство по программированию CUDA с -использованием -быстрой -математической оптимизации, и хотя в приложении C упоминаются деления, которые должны быть преобразованы во встроенные, но нет упоминания об умножениях. Причина, по которой я задаю этот вопрос, заключается в том, что в моем ядре много умножений. Я знаю, что NVCC попытается объединить операции умножения и сложения (, когда используются обычные операторы ' *' и '+', и что встроенные функции никогда не объединяются с операциями FMAD ). Но если мой код сильно умножается, то будет ли преимущество, если используется округление -от встроенного SP, такого как __fmul_rn?

Итак, есть два вопроса:

  1. Использует ли --быструю -математическую опцию для перевода умножений с оператором '*' в встроенные функции SP, такие как __fmul _rn?

  2. Может ли быть выигрыш в производительности при ручном -кодировании умножений для явного использования __fmul _rn? Пример или некоторые цифры помогут мне понять.

5
задан einpoklum - reinstate Monica 19 November 2016 в 23:36
поделиться