5
ответов

Что делает PowerPC Apple memcpy настолько быстро?

Я записал несколько функций копии в поисках хорошей стратегии памяти относительно PowerPC. Используя Altivec или регистры fp с подсказками кэша (dcb*) удваивает производительность по простому циклу копии байта для...
вопрос задан: 2 January 2010 02:35
0
ответов

эффективный способ преобразования индексов разброса в индексы сбора?

Я пытаюсь написать сжатие потока (взять массив и избавиться от пустых элементов) с внутренними функциями SIMD. Каждая итерация цикла обрабатывает 8 элементов за раз (ширина SIMD). С помощью встроенных функций SSE ...
вопрос задан: 7 June 2011 19:36