Официальное руководство Intel по оптимизации содержит главу о преобразовании команд MMX в SSE, где они указывают следующий статус:
Команды вычислений, которые используют операнд памяти, который не могут быть выровнены по 16-байтовой границе, должны быть заменены невыровненной 128-битной загрузкой (MOVDQU), за которой следует та же вычислительная операция, которая вместо этого использует регистровые операнды.
(глава 5.8 Преобразование 64-битных в 128-битные целые числа SIMD, стр. 5-43)
Я не могу понять, что они подразумевают под "может быть не выровнено по 16-байтовой границе", может поясните пожалуйста и приведите примеры?