Создание kd-дерева в cuda

Например, у меня есть массив точек (x, y), и я хочу организовать их в kd-tree

Построение kd-дерева включает в себя сортировку и вычисления ограничивающие рамки. Эти алгоритмы отлично работают на CUDA, но есть ли способ построить kd-tree, используя как можно больше потоков?

Думаю, здесь должны быть уловки:

Обычно kd-tree реализуется с помощью рекурсии, но, насколько мне известно, процессоры CUDA не имеют аппаратного стека, Дамп ассемблерного кода для функции foo: 0x00000000004004a8 : нажать% rbp 0x00000000004004a9 : mov% rsp,% rbp 0x00000000004004ac : mov 0x13c (...

(gdb) disas foo
Dump of assembler code for function foo:
0x00000000004004a8 <foo+0>: push   %rbp
0x00000000004004a9 <foo+1>: mov    %rsp,%rbp
0x00000000004004ac <foo+4>: mov    0x13c(%rip),%eax        # 0x4005ee <__dso_handle+30>
0x00000000004004b2 <foo+10>:    mov    %eax,-0x10(%rbp)
0x00000000004004b5 <foo+13>:    lea    -0x10(%rbp),%rax
0x00000000004004b9 <foo+17>:    add    $0x18,%rax
0x00000000004004bd <foo+21>:    mov    %rax,%rdx
0x00000000004004c0 <foo+24>:    mov    $0x400498,%eax
0x00000000004004c5 <foo+29>:    mov    %eax,(%rdx)
0x00000000004004c7 <foo+31>:    leaveq 
0x00000000004004c8 <foo+32>:    retq   
(gdb) l foo
8   void foo() {
9       char overme[4] = "WOW";
10      *(int*)(overme+24) = (int)bad;
11  }

Почему не только 8 байтов?

7
задан Jonathon Reinhart 19 October 2017 в 16:52
поделиться