5
ответов

Быстро 4x4 умножение матриц в C

Я пытаюсь найти оптимизированный C или Ассемблерную реализацию функции, которая умножается два 4x4 матрицы друг с другом. Платформа является ARM6, или ARM7 основывал iPhone или iPod. В настоящее время я...
вопрос задан: 4 November 2009 14:53
4
ответа

модель процессора обнаружения iPhone / НЕОНОВАЯ поддержка

Я ищу способ дифференцироваться во времени выполнения между устройствами, оборудованными новым процессором ARM (такими как iPhone 3GS и некоторые iPods 3G) и устройствами, оборудованными старыми процессорами ARM. Я знаю меня...
вопрос задан: 26 October 2009 17:17
3
ответа

Как я переупорядочиваю векторные данные с помощью Неона ARM intrinsics?

Это конкретно связано с Неоном ARM кодирование SIMD. Я использую Неон ARM instrinsics для определенного модуля в видеодекодере. У меня есть векторизованные данные следующим образом: существует четыре элемента на 32 бита в...
вопрос задан: 21 July 2014 10:31
2
ответа

Общие методы SIMD

Где я могу найти информацию об общих приемах SIMD? Я имею систему команд и знаю, как написать нехитрый код SIMD, но я знаю, SIMD теперь намного более мощен. Это может содержать комплекс...
вопрос задан: 9 December 2011 00:29
2
ответа

Как использовать умножение и накопить intrinsics в Коре-a8 ARM?

как использовать Умножение - Накапливают intrinsics, обеспеченный GCC? float32x4_t vmlaq_f32 (float32x4_t, float32x4_t, float32x4_t); Может любой объяснять, что три параметра я должен передать этому...
вопрос задан: 13 July 2010 18:56
2
ответа

Быстрый синус/косинус для ARMv7+NEON: поиск тестеров …

Мог кто-то с доступом к iPhone 3GS или Pandora, протестируйте следующую ассемблерную подпрограмму, которую я просто записал? Это, как предполагается, вычисляет синусы и косинусы действительно действительно быстро на НЕОНОВОМ векторном FPU....
вопрос задан: 6 December 2009 03:30
1
ответ

CodeSourcery, дающий ошибку компиляции: недостающие биты/C++ config.h

в моем проекте я использую Собственную библиотеку C++ для линейной алгебры. ТОЛЬКО, когда я включаю флаги векторизации (-mfpu=neon-mfloat-abi=softfp) для НЕОНА ARM, я получаю ошибку компилятора - C++ config.h нет...
вопрос задан: 20 July 2010 14:01
1
ответ

Существует ли хорошая ссылка для Неона ARM intrinsics?

Справочник ARM не вдается в слишком большое количество подробностей в отдельные инструкции (http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0348b/BABIIBBG.html). Есть ли что-то...
вопрос задан: 17 May 2010 17:52
1
ответ

Как инициализировать константу float32x4x4_t (внутренний НЕОН ARM, GCC)?

Я могу инициализировать float32x4_t как это: константа float32x4x4_t обнуляет = {0.0f, 0.0f, 0.0f, 0.0f}; Но этот код совершает ошибку Несовместимые типы в инициализаторе: константа float32x4x4_t одна = {1.0f...
вопрос задан: 1 May 2010 12:24
0
ответов

Arm Neon Intrinsics против ручной сборки

https://web.archive.org/web/20170227190422/http://hilbert-space.de/?p=22 На этом довольно устаревшем сайте показано, что написанный от руки ассемблер дал бы гораздо большее улучшение, чем встроенные функции. Я ...
вопрос задан: 14 November 2018 05:14
0
ответов

Разделить на число с плавающей запятой с помощью встроенных функций NEON

Я обрабатываю изображение на четыре пикселя одновременно, это на armv7 для приложения Android. Я хочу разделить вектор float32x4_t на другой вектор, но числа в нем отличаются от примерно 0 ....
вопрос задан: 5 October 2018 13:35
0
ответов

128 -чередование битов с использованием встроенных функций ARM Neon

Я пытаюсь оптимизировать свой код, используя встроенные функции Neon. У меня есть 24 -битное вращение по 128 -битному массиву (8 каждый uint16 _t ). Вот мой код c :uint16 _t rotated[8]; uint16 _t темп[8]; uint16 _tj; для (j = 0;...
вопрос задан: 23 November 2017 06:36
0
ответов

CORTEX A9 NEON VS VFP Использование Путаница

Я пытаюсь построить библиотеку для процессора ARM Cortex A9 (OMAP4, чтобы быть более конкретным), и я в небольшом количестве путаницы относительно которой \ когда Используйте Neon VS VFP в контексте плавающей точке ...
вопрос задан: 23 May 2017 10:30
0
ответов

ARM to C calling convention, NEON registers to save

There is a similar post that covers regular registers. What about NEON registers. As far as I remember either top half or bottom half of registers have to be preserved across function calls. I can't ...
вопрос задан: 23 May 2017 10:29
0
ответов

На iOS как быстро преобразовать RGB24 в BGR24?

Я использую vImageConvert _RGB888toPlanar8 и vImageConvert _Planar8toRGB888 из Accelerate.framework для преобразования RGB24 в BGR24, но когда данные, которые необходимо преобразовать, очень велики, например, 3M или 4M, время...
вопрос задан: 25 February 2015 14:54
0
ответов

Система сборки Android, сборки NEON и не-NEON

Я хочу собрать свою библиотеку для armv6, и есть некоторый неоновый код, который я включаю во время выполнения, если устройство поддерживает его . Неоновый код использует встроенные функции неона, и чтобы его можно было скомпилировать, я должен включить
вопрос задан: 17 July 2014 18:54
0
ответов

Загрузить 8-битный uint8_t как uint32_t?

Мой проект обработки изображений работает с изображениями в градациях серого. У меня процессорная платформа ARM Cortex-A8. Я хочу использовать НЕОН. У меня есть изображение в градациях серого (рассмотрим пример ниже), и в моем ...
вопрос задан: 10 April 2014 15:30
0
ответов

какая самая быстрая библиотека БПФ для устройств iOS / Android ARM? [закрыто]

Какая самая быстрая библиотека БПФ для устройств iOS / Android ARM? И какую библиотеку люди обычно используют на платформах iOS / Android? Я предполагаю, что vDSP - это библиотека, наиболее часто используемая в iOS. РЕДАКТИРОВАТЬ: мой ...
вопрос задан: 16 July 2013 23:50
0
ответов

ARM Cortex -A8: Как использовать NEON и vfpv3

Я использую процессор Cortex-A8 и не понимаю, как использовать флаг -mfpu. На Cortex-A8 есть сопроцессоры как vfpv3, так и neon. Раньше я не знал, как использовать неон, поэтому я ...
вопрос задан: 23 March 2013 05:57
0
ответов

ARM Cortex-A8: В чем разница между VFP и NEON

В процессоре ARM Cortex-A8 я понимаю, что такое NEON, это сопроцессор SIMD. Но работает ли модуль VFP (Vector Floating Point), который также является сопроцессором, как процессор SIMD? Если да, то какой ...
вопрос задан: 8 February 2013 22:17
0
ответов

Использование встроенных функций ARM NEON для добавления альфы и перестановки

Я разрабатываю приложение для iOS, которое должно довольно быстро преобразовывать изображения из RGB -> BGRA. Я хотел бы использовать встроенные функции NEON, если это возможно. Есть ли более быстрый способ, чем простое назначение компонентов?...
вопрос задан: 9 August 2012 19:56
0
ответов

SSE _мм _маска перемещения _эквивалентный метод epi8 для ARM NEON

Я решил продолжить оптимизацию быстрых поворотов и застрял на _mm _маска перемещения _инструкция epi8 SSE. Как я могу переписать его для ARM Neon с вводом uint8x16 _t?
вопрос задан: 8 August 2012 18:45
0
ответов

Оптимизация с помощью сборки NEON

Я пытаюсь оптимизировать некоторые части кода OpenCV, используя NEON. Вот оригинальный блок кода, над которым я работаю. (Примечание :Если это имеет какое-либо значение, вы можете найти полный исходный код в "opencvfolder/modules/video/...
вопрос задан: 26 July 2012 14:03
0
ответов

Как программы Android используют NEON SIMD?

Я немного изучил возможности процессора и наткнулся на NEON. Из того, что я читал, похоже, что для использования NEON требуется специальное программирование, но так ли это на самом деле, или нужно...
вопрос задан: 17 July 2012 02:27
0
ответов

C, ассемблер, производительность NEON

Я работаю над приложением для iPhone, которое выполняет обработку изображений в реальном времени. Одним из первых шагов в его конвейере является преобразование изображения BGRA в оттенки серого. Я попробовал несколько разных методов и...
вопрос задан: 16 July 2012 20:45
0
ответов

Неоновый эквивалент характеристикам SSE

Я пытаюсь преобразовать код c в оптимизированный, используя неоновые встроенные функции. Вот коды c, которые работают с двумя оперантами, а не с векторами оперантов. uint16 _t mult _z216 (uint16 _t a,uint16 _t b ){...
вопрос задан: 3 July 2012 09:33
0
ответов

Android CPU Архитектура ARM

У нас есть код, зависящий от процессора Android, и я хотел бы узнать, сколько устройств, используемых клиентами, относятся к ARMv6/ARMv7, есть ли еще ARM v5, сколько ARMv6 имеют VFP, что Tegra или Neon ...
вопрос задан: 6 June 2012 19:20
0
ответов

Преобразование между SSE и NEON Intrinsics-Shuffling

Я пытаюсь преобразовать код, написанный на встроенных функциях SSE3, в NEON SIMD и застрял из-за функции перемешивания. Я просмотрел встроенные функции GCC, руководства ARM и другие форумы но не было ...
вопрос задан: 14 May 2012 22:02
0
ответов

Эффективное сравнение с плавающей запятой (Cortex -A8)

Существует большой (~100 000 )массив переменных с плавающей запятой, а также порог (также с плавающей запятой ). Проблема в том, что я должен сравнить каждую переменную из массива с порогом,...
вопрос задан: 30 April 2012 10:41
0
ответов

Android ARMv6 / v7 и VFP / NEON

Я хотел бы больше узнать о процессорах, используемых на телефонах Android. Причина в том, что мы создаем библиотеку C, которая имеет определенные флаги архитектуры процессора / математического процессора, которые мы можем установить. Пока что у нас есть
вопрос задан: 28 February 2012 21:38