Я пытаюсь оптимизировать некоторую арифметику при помощи MMX и систем команд SSE со встроенным ассемблерным кодом. Однако я не мог найти хорошие ссылки для синхронизаций и использований этих расширенных систем команд. Вы могли помочь мне найти ссылки, которые содержат информацию о пропускной способности, задержке, операндах и возможно кратких описаниях инструкций?
До сих пор я нашел:
Intel Instruction References Intel 64 и руководство разработчика архитектуры IA-32: издание 2A и Intel 64 и руководство разработчика архитектуры IA-32: издание 2B
Intel Optimization Guide http://www.intel.com/Assets/PDF/manual/248966.pdf
Синхронизации целочисленных операций http://gmplib.org/~tege/x86-timing.pdf
Справочник по инструкциям Intel должен служить адекватным руководством к тому, что на самом деле делают эти инструкции, подумал бы я? Он имеет псевдокод для каждого из них, описание его работы, а в некоторых случаях даже небольшую диаграмму репрезентативного случая.
Что касается хронометража, нет официального руководства, о котором я знаю. Страница Агнера Фога является стандартной ссылкой: