Почему сложные memcpy / memset superior?

Question

Почему сложные memcpy / memset superior?

При отладке я часто заходил в рукописная ассемблерная реализация memcpy и memset. Обычно они реализуются с использованием потоковых инструкций, если они доступны, развернутого цикла, оптимизированного выравнивания и т. д. Я также недавно столкнулся с этой «ошибкой» из-за оптимизации memcpy в glibc .

Возникает вопрос: почему производители оборудования (Intel, AMD) не могут оптимизировать конкретный случай

rep stos

и

rep movs

, чтобы их можно было распознать как таковые, и сделать максимально быстрое заполнение и копирование на собственной архитектуре?

22

c optimization assembly x86 64-bit

задан Kieran 13 January 2012 в 23:53

0 ответов

Другие вопросы по тегам:

c optimization assembly x86 64-bit

Почему сложные memcpy / memset superior?

0 ответов

Похожие вопросы: