InvalidKernelArgs для enqueueNDRange, в то время как аналогичный вызов работает нормально

not необходимо поместить реализацию в файл заголовка, см. альтернативное решение в конце этого ответа.

В любом случае причина, по которой ваш код не работает, что при создании экземпляра шаблона компилятор создает новый класс с заданным аргументом шаблона. Например:

template
struct Foo
{
    T bar;
    void doSomething(T param) {/* do stuff using T */}
};

// somewhere in a .cpp
Foo f; 

При чтении этой строки компилятор создаст новый класс (назовем его FooInt), что эквивалентно следующему:

struct FooInt
{
    int bar;
    void doSomething(int param) {/* do stuff using int */}
}

Следовательно, компилятор должен иметь доступ к реализации методов, чтобы создать экземпляр с аргументом шаблона (в данном случае int). Если эти реализации не были в заголовке, они не были бы доступны, поэтому компилятор не смог бы создать экземпляр шаблона.

Общим решением для этого является запись объявления шаблона в заголовок файла, затем реализовать класс в файле реализации (например, .tpp) и включить этот файл реализации в конец заголовка.

// Foo.h
template 
struct Foo
{
    void doSomething(T param);
};

#include "Foo.tpp"

// Foo.tpp
template 
void Foo::doSomething(T param)
{
    //implementation
}

Таким образом, реализация по-прежнему отделена от объявления, но доступен компилятору.

Другое решение состоит в том, чтобы сохранить реализацию отдельно и явно создать все экземпляры шаблона, которые вам понадобятся:

// Foo.h

// no implementation
template  struct Foo { ... };

//----------------------------------------    
// Foo.cpp

// implementation of Foo's methods

// explicit instantiations
template class Foo;
template class Foo;
// You will only be able to use Foo with int or float

Если мое объяснение isn ' t достаточно ясно, вы можете взглянуть на C ++ Super-FAQ по этому вопросу .

0
задан Helios 4 March 2019 в 14:55
поделиться

1 ответ

___ константа, похоже, имеет ограничение по размеру (хотя это не удалось найти в спецификации).

Ограничения зависят от устройства. Постоянные буферы имеют ограничение размера каждого буфера (CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE, мин. 64 КБ), а также существует ограничение на количество постоянных аргументов, которые можно передать ядру (CL_DEVICE_MAX_CONSTANT_ARGS, мин. 8). Как AMD, так и Nvidia GPU обычно близки к минимумам, поэтому общий объем данных, которые можно передать как __constant, может быть очень небольшим.

Смысл «постоянной» памяти не в том, чтобы передавать вводимые пользовательские данные только для чтения ядрам (как вы, похоже, их используете); Дело в том, чтобы хранить специфичные для алгоритма константы (справочные таблицы, коэффициенты матрицы / полинома / фильтра и т. д.). Если вы хотите передать входные данные только для чтения, обычным способом является объявление аргумента ядра как __global const <type>* и создание соответствующего буфера с CL_MEM_READ_ONLY.

Здесь немного больше понимания.

0
ответ дан mogu 4 March 2019 в 14:55
поделиться
Другие вопросы по тегам:

Похожие вопросы: