потоковая загрузка и память, отличная от USWC

Я только что прочитал эту довольно интересную статью, Копирование буферов кадра ускоренного декодирования видео .

Там объясняется, как сделать копирование из памяти USWC как можно быстрее с использованием потоковой загрузки.

Мой вопрос в том, почему этот метод не может также ускорить обычные копии из памяти, отличной от USWC?

При потоковой загрузке будет прочитана вся строка кэша за один раз вместо обычной загрузки, которая загружает только 16 байтов за раз. Что мне не хватает? И копирование из буфера заполнения в «буфер кеша», который будет записан в кеш, не может иметь больших накладных расходов, не так ли?

6
задан ronag 16 May 2011 в 11:17
поделиться