Я пытаюсь найти оптимизированный C или Ассемблерную реализацию функции, которая умножается два 4x4 матрицы друг с другом. Платформа является ARM6, или ARM7 основывал iPhone или iPod. В настоящее время я...
Я ищу способ дифференцироваться во времени выполнения между устройствами, оборудованными новым процессором ARM (такими как iPhone 3GS и некоторые iPods 3G) и устройствами, оборудованными старыми процессорами ARM. Я знаю меня...
Это конкретно связано с Неоном ARM кодирование SIMD. Я использую Неон ARM instrinsics для определенного модуля в видеодекодере. У меня есть векторизованные данные следующим образом: существует четыре элемента на 32 бита в...
Где я могу найти информацию об общих приемах SIMD? Я имею систему команд и знаю, как написать нехитрый код SIMD, но я знаю, SIMD теперь намного более мощен. Это может содержать комплекс...
как использовать Умножение - Накапливают intrinsics, обеспеченный GCC? float32x4_t vmlaq_f32 (float32x4_t, float32x4_t, float32x4_t); Может любой объяснять, что три параметра я должен передать этому...
Мог кто-то с доступом к iPhone 3GS или Pandora, протестируйте следующую ассемблерную подпрограмму, которую я просто записал? Это, как предполагается, вычисляет синусы и косинусы действительно действительно быстро на НЕОНОВОМ векторном FPU....
в моем проекте я использую Собственную библиотеку C++ для линейной алгебры. ТОЛЬКО, когда я включаю флаги векторизации (-mfpu=neon-mfloat-abi=softfp) для НЕОНА ARM, я получаю ошибку компилятора - C++ config.h нет...
Справочник ARM не вдается в слишком большое количество подробностей в отдельные инструкции (http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0348b/BABIIBBG.html). Есть ли что-то...
Я могу инициализировать float32x4_t как это: константа float32x4x4_t обнуляет = {0.0f, 0.0f, 0.0f, 0.0f}; Но этот код совершает ошибку Несовместимые типы в инициализаторе: константа float32x4x4_t одна = {1.0f...
https://web.archive.org/web/20170227190422/http://hilbert-space.de/?p=22 На этом довольно устаревшем сайте показано, что написанный от руки ассемблер дал бы гораздо большее улучшение, чем встроенные функции. Я ...
Я обрабатываю изображение на четыре пикселя одновременно, это на armv7 для приложения Android. Я хочу разделить вектор float32x4_t на другой вектор, но числа в нем отличаются от примерно 0 ....
Я пытаюсь оптимизировать свой код, используя встроенные функции Neon. У меня есть 24 -битное вращение по 128 -битному массиву (8 каждый uint16 _t ). Вот мой код c :uint16 _t rotated[8]; uint16 _t темп[8]; uint16 _tj; для (j = 0;...
Я пытаюсь построить библиотеку для процессора ARM Cortex A9 (OMAP4, чтобы быть более конкретным), и я в небольшом количестве путаницы относительно которой \ когда Используйте Neon VS VFP в контексте плавающей точке ...
There is a similar post that covers regular registers. What about NEON registers. As far as I remember either top half or bottom half of registers have to be preserved across function calls.
I can't ...
Я использую vImageConvert _RGB888toPlanar8 и vImageConvert _Planar8toRGB888 из Accelerate.framework для преобразования RGB24 в BGR24, но когда данные, которые необходимо преобразовать, очень велики, например, 3M или 4M, время...
Я хочу собрать свою библиотеку для armv6, и есть некоторый неоновый код, который я включаю во время выполнения, если устройство поддерживает его . Неоновый код использует встроенные функции неона, и чтобы его можно было скомпилировать, я должен включить
Мой проект обработки изображений работает с изображениями в градациях серого. У меня процессорная платформа ARM Cortex-A8. Я хочу использовать НЕОН. У меня есть изображение в градациях серого (рассмотрим пример ниже), и в моем ...
Какая самая быстрая библиотека БПФ для устройств iOS / Android ARM? И какую библиотеку люди обычно используют на платформах iOS / Android? Я предполагаю, что vDSP - это библиотека, наиболее часто используемая в iOS. РЕДАКТИРОВАТЬ: мой ...
Я использую процессор Cortex-A8 и не понимаю, как использовать флаг -mfpu. На Cortex-A8 есть сопроцессоры как vfpv3, так и neon. Раньше я не знал, как использовать неон, поэтому я ...
В процессоре ARM Cortex-A8 я понимаю, что такое NEON, это сопроцессор SIMD. Но работает ли модуль VFP (Vector Floating Point), который также является сопроцессором, как процессор SIMD? Если да, то какой ...
Я разрабатываю приложение для iOS, которое должно довольно быстро преобразовывать изображения из RGB -> BGRA. Я хотел бы использовать встроенные функции NEON, если это возможно. Есть ли более быстрый способ, чем простое назначение компонентов?...
Я решил продолжить оптимизацию быстрых поворотов и застрял на _mm _маска перемещения _инструкция epi8 SSE. Как я могу переписать его для ARM Neon с вводом uint8x16 _t?
Я пытаюсь оптимизировать некоторые части кода OpenCV, используя NEON. Вот оригинальный блок кода, над которым я работаю. (Примечание :Если это имеет какое-либо значение, вы можете найти полный исходный код в "opencvfolder/modules/video/...
Я немного изучил возможности процессора и наткнулся на NEON. Из того, что я читал, похоже, что для использования NEON требуется специальное программирование, но так ли это на самом деле, или нужно...
Я работаю над приложением для iPhone, которое выполняет обработку изображений в реальном времени. Одним из первых шагов в его конвейере является преобразование изображения BGRA в оттенки серого. Я попробовал несколько разных методов и...
Я пытаюсь преобразовать код c в оптимизированный, используя неоновые встроенные функции. Вот коды c, которые работают с двумя оперантами, а не с векторами оперантов. uint16 _t mult _z216 (uint16 _t a,uint16 _t b ){...
У нас есть код, зависящий от процессора Android, и я хотел бы узнать, сколько устройств, используемых клиентами, относятся к ARMv6/ARMv7, есть ли еще ARM v5, сколько ARMv6 имеют VFP, что Tegra или Neon ...
Я пытаюсь преобразовать код, написанный на встроенных функциях SSE3, в NEON SIMD и застрял из-за функции перемешивания. Я просмотрел встроенные функции GCC, руководства ARM и другие форумы но не было ...
Существует большой (~100 000 )массив переменных с плавающей запятой, а также порог (также с плавающей запятой ). Проблема в том, что я должен сравнить каждую переменную из массива с порогом,...
Я хотел бы больше узнать о процессорах, используемых на телефонах Android. Причина в том, что мы создаем библиотеку C, которая имеет определенные флаги архитектуры процессора / математического процессора, которые мы можем установить. Пока что у нас есть