У меня есть стойка Dell Precision с Ubuntu Precise и двумя Tesla C2075 плюс Quadro 600, который является устройством отображения. Недавно я закончил несколько тестов на своем настольном -компьютере и теперь попытался перенести данные на рабочую станцию.
Поскольку CUDA не было, я установил его в соответствии с этим руководством и адаптировал Makefiles SDK в соответствии с этими предложениями .
Теперь я столкнулся с тем, что ни один образец (, который я тестировал, как 10 разных ), не работает.Это ошибки, которые я получаю:
[deviceQuery] starting...
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED
> exiting in 3 seconds: 3...2...1...done!
[MonteCarloMultiGPU] starting...
CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method = threaded
Problem scaling = weak
Number of GPUs = 0
Total number of options = 0
Number of paths = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)
[reduction] starting...
reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.
[simplePrintf] starting...
simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.
Как видите, большинство ошибок указывают на проблему с вызовом cudaGetDeviceCount, который возвращает код ошибки 10. Согласно руководству, проблема:
cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.
К сожалению, единственное решение, которое мне удалось найти, заключалось в проверке разъемов питания устройства. Я так делал, и в этом не было ничего плохого. Перезагрузка рабочей станции тоже не помогает.
Я был бы рад предоставить более подробную информацию о моей конфигурации. Просто оставьте комментарий!