Например, у меня есть массив точек (x, y), и я хочу организовать их в kd-tree
Построение kd-дерева включает в себя сортировку и вычисления ограничивающие рамки. Эти алгоритмы отлично работают на CUDA, но есть ли способ построить kd-tree, используя как можно больше потоков?
Думаю, здесь должны быть уловки:
Обычно kd-tree реализуется с помощью рекурсии, но, насколько мне известно, процессоры CUDA не имеют аппаратного стека,
Дамп ассемблерного кода для функции foo:
0x00000000004004a8 Почему не только 8 байтов? (gdb) disas foo
Dump of assembler code for function foo:
0x00000000004004a8 <foo+0>: push %rbp
0x00000000004004a9 <foo+1>: mov %rsp,%rbp
0x00000000004004ac <foo+4>: mov 0x13c(%rip),%eax # 0x4005ee <__dso_handle+30>
0x00000000004004b2 <foo+10>: mov %eax,-0x10(%rbp)
0x00000000004004b5 <foo+13>: lea -0x10(%rbp),%rax
0x00000000004004b9 <foo+17>: add $0x18,%rax
0x00000000004004bd <foo+21>: mov %rax,%rdx
0x00000000004004c0 <foo+24>: mov $0x400498,%eax
0x00000000004004c5 <foo+29>: mov %eax,(%rdx)
0x00000000004004c7 <foo+31>: leaveq
0x00000000004004c8 <foo+32>: retq
(gdb) l foo
8 void foo() {
9 char overme[4] = "WOW";
10 *(int*)(overme+24) = (int)bad;
11 }