Я решил продолжить оптимизацию быстрых поворотов и застрял на _mm_movemask_epi8Инструкция SSE. Как я могу переписать его для ARM Neon с вводом uint8x16_t?
_mm_movemask_epi8
uint8x16_t