0
ответов

Тесты ARM Cortex A8: может ли кто-нибудь помочь мне разобраться в этих цифрах?

Я работаю над написанием нескольких алгоритмов DSP в реальном времени для Android, поэтому я решил запрограммировать ARM прямо в сборке, чтобы оптимизировать все как как можно больше и сделать математику максимально ...
вопрос задан: 8 November 2011 17:04
0
ответов

Что такое Neon по отношению к Android?

Я новичок в Android. Мой друг слышал «Неон». Итак, я зашел в Google и обнаружил, что Neon связан с мультимедиа для ОС Android или всех мобильных ОС, не так ли? Поделитесь, пожалуйста, подробнее.
вопрос задан: 1 November 2011 06:56
0
ответов

Оптимизация преобразования RGBA8888 в RGB565 с помощью NEON

Я пытаюсь оптимизировать преобразование формата изображения на iOS, используя набор векторных инструкций NEON. Я предположил, что это будет хорошо соответствовать этому, потому что он обрабатывает кучу похожих данных.Мои попытки не…
вопрос задан: 10 October 2011 00:49
0
ответов

Проблемы с двухъядерным кодом ARM NEON Qualcomm Scorpion?

Я разрабатываю собственную библиотеку для Android, в которой я использую оптимизацию сборки ARM и многопоточность, чтобы получить максимальную производительность на двухъядерный чипсет ARM MSM8660. Выполняя некоторые ...
вопрос задан: 29 September 2011 13:27
0
ответов

NEON vs Intel SSE - эквивалентность определенных операций

У меня возникли некоторые проблемы с выяснением эквивалентности NEON пары операций Intel SSE. Кажется, что NEON не может обрабатывать сразу весь регистр Q (тип данных со 128-битным значением). Я ...
вопрос задан: 26 August 2011 10:15
0
ответов

Суммируйте все элементы в векторе четверного слова в сборке ARM с помощью NEON

Я довольно новичок в сборке, и хотя информационный центр руки часто бывает полезен, иногда инструкции могут немного запутать новичка . В основном то, что мне нужно сделать, это суммировать 4 значения с плавающей запятой ...
вопрос задан: 3 August 2011 18:17
0
ответов

Самый быстрый способ побитового И между двумя массивами на iPhone?

У меня есть два блока изображений, сохраненных как одномерные массивы, и я должен выполнить следующие побитовые операции И между их элементами. int compare (unsigned char * a, int a_pitch, unsigned char * b, int ...
вопрос задан: 14 June 2011 02:15
0
ответов

Mixing NEON assembly with non-vector functions

I think I found the answer to my question. There is an "fmacs" instruction for VFP which may do the trick which does scalar computation on NEON/VFP registers. I'm very new to NEON or ARM programming.....
вопрос задан: 16 May 2011 19:49
0
ответов

Почему arm-gcc уменьшает / увеличивает указатель стека, даже если к стеку никогда не обращаются?

При компиляции этой программы с помощью arm-elf-gcc-4.5 -O3 -march = armv7-a -mthumb -mfpu = neon -mfloat-abi = softfp: #include extern float32x4_t cross (const float32x4_t & v1, const ...
вопрос задан: 10 May 2011 03:38
0
ответов

Почему ARM NEON не быстрее обычного C ++?

Вот код C ++: #define ARR_SIZE_TEST (8 * 1024 * 1024) void cpp_tst_add (без знака * x, без знака * y) {for (register int i = 0; i
вопрос задан: 21 April 2011 07:34
0
ответов

Neon Оптимизация с использованием встроенных функций

Изучая встроенные функции ARM NEON, я рассчитывал функцию, которую я написал, для удвоения элементов в массиве. Версия, в которой используются встроенные функции, занимает больше времени, чем простая версия функции C. ...
вопрос задан: 20 April 2011 11:15
0
ответов

Сравнение 128-битных хеш-кодов с SSE

В моем текущем проекте мне нужно сравнить 128-битные значения (на самом деле хеши md5), и я подумал, что можно ускорить сравнение, используя Инструкции SSE. Моя проблема в том, что я не могу ...
вопрос задан: 26 December 2010 14:48
0
ответов

ARM GCC bug? Uses chains of vldr instead of one vldmia…

Consider the following NEON-optimized function: void mat44_multiply_neon(float32x4x4_t& result, const float32x4x4_t& a, const float32x4x4_t& b) { // Make sure "a" is mapped to ...
вопрос задан: 24 December 2010 08:59
0
ответов

удаление повторяющихся записей из массива multi-d в python

У меня есть двумерный массив xx = [[a, 1], [b, 2], [c, 3]] Теперь я пытаюсь удалить из него повторяющиеся записи. Для простого одномерного массива подойдет простой код, например xx = list (set (xx)). Но пытаюсь установить двумерные элементы ...
вопрос задан: 29 September 2010 08:07
0
ответов

3x3 Матричное обратное возможное использование инструкции SIMD?

Я использую ARM основанный на коре-A8 процессор, и у меня есть несколько мест, где я вычисляю 3x3 Матричные обратные операции. Поскольку процессор Коры-a8 имеет процессор NEON SIMD, мне интересно...
вопрос задан: 26 July 2010 10:58