Я разрабатываю собственную библиотеку для Android, в которой я использую оптимизацию сборки ARM и многопоточность, чтобы получить максимальную производительность на двухъядерном чипсете ARM MSM8660. Выполняя некоторые измерения, я заметил следующее:
Я попытался найти в сети объяснение, почему это так, но пока не нашел. Кажется, что все ядра используют один и тот же NEON-конвейер или что-то в этом роде, но все схемы, похоже, указывают на то, что каждое ядро должно иметь свой собственный NEON-модуль. Кто-нибудь знает, почему это происходит?