Производительность инструкций x86 rep на современных (конвейерных/суперскалярных) процессорах

В последнее время я пишу на ассемблере x86 (для развлечения) и мне стало интересно, действительно ли строковые инструкции с префиксом rep имеют преимущество в производительности на современных процессорах или они просто реализованы для обратной совместимости.

Я могу понять, почему Intel изначально реализовала инструкции rep тогда, когда процессоры выполняли только одну инструкцию за раз, но есть ли польза от их использования сейчас?

С циклом, который компилируется в большее количество инструкций, есть больше возможностей заполнить конвейер и/или быть выданным не по порядку. Созданы ли современные процессоры для оптимизации под эти инструкции с префиксом rep, или инструкции rep настолько редко используются в современном коде, что они не важны для производителей?

18
задан RyanS 8 December 2011 в 01:23
поделиться