Эффективность ветвления в шейдерах

Question

Эффективность ветвления в шейдерах

Я понимаю, что этот вопрос может показаться несколько необоснованным, но , если кто-то знает что-то теоретическое / имеет практический опыт по этой теме, было бы здорово, если бы вы этим поделились. 12110] Я пытаюсь оптимизировать один из моих старых шейдеров, который использует много текстурных поисков.

У меня есть диффузный, нормальный, карты отражений для каждой из трех возможных плоскостей отображения и для некоторых лиц, которые находятся рядом с пользователем, я также должен применить методы отображения, которые также приносят много текстурных поисков (например, отображение параллакса ) .

Профилирование показало, что поиск текстур является узким местом шейдера, и я готов убрать некоторые из них. Для некоторых случаев входных параметров я уже знаю, что часть поиска текстуры будет ненужной и очевидное решение - это сделать что-то вроде (псевдокод) :

if (part_actually_needed) { perform lookups; perform other steps specific for THIS PART; } // All other parts.

Теперь - вот вопрос.

Я точно не помню (поэтому я сказал, что вопрос может быть необоснованным ), но в какой-то статье я недавно прочитал (к сожалению, могу ' техника зависит от того, насколько эффективна ОБЯЗАТЕЛЬНОЕ ОБОРУДОВАНИЕ Реализовано BRANCHING .

Я вспомнил этот вид оператора прямо перед тем, как начал рефакторинг большого количества шейдеров и реализовать ту оптимизацию на основе if , о которой я говорил.

Итак - прямо перед тем, как я начал это делать - кто-нибудь знает что-нибудь об эффективности ветвления в шейдерах? Почему ветвление может серьезно снизить производительность шейдеров?

И возможно ли, что я смог бы только ухудшить реальную производительность с помощью ветвления на основе if ?

Вы могли бы сказать - попробуй и посмотри. Да, это то, что я сделаю, если здесь никто мне не поможет :)

Но все же то, что в случае if может быть эффективным для новых GPU, может стать кошмаром для немного более старых .

38

performance branch shader

задан duplode 21 July 2015 в 06:25
поделиться

0 ответов

Другие вопросы по тегам:
performance branch shader

Похожие вопросы:

39
Какую самую нелепую пессимизацию вы видели? [закрыто] - 3 May 2012 14:43

38
Если одно использование <или <= в для [замкнутого] круга - 8 October 2008 21:29

35
Какие простые изменения делали самые большие улучшения Ваших программ Delphi [закрытыми] - 5 September 2013 01:28

33
Разработчик должен стремиться к удобочитаемости или производительности сначала? [закрытый] - 8 October 2008 16:11

31
В.NET, которую цикл выполняет быстрее, 'для' или 'foreach'? - 13 June 2012 06:30

31
Когда сборка происходит быстрее, чем C? - 3 January 2018 15:58

29
[Закрываются] любимые настраивающие приемы производительности - 27 August 2014 11:44