У меня есть два одномерных массива numpy одинаковой длины, id
и data
, где id
- это последовательность повторяющихся упорядоченных целых чисел, которые определяют подокна на data
. Например,
id data
1 2
1 7
1 3
2 8
2 9
2 10
3 1
3 -10
я хотел бы агрегировать данные
путем группировки по id
и взятия либо максимального, либо минимального значения. В SQL это был бы типичный запрос на агрегацию, например SELECT MAX(data) FROM tablename GROUP BY id ORDER BY id
. Есть ли способ избежать циклов Python и сделать это векторным способом, или мне придется опуститься до C?