要開始研究opencl了,雖然CUDA比較好寫,但opencl是開放的阿...

要開始研究opencl了。


雖然之前寫了cuda有一點點經驗,而且opencl跟cuda的架構相似。

沖著你opencl是開放格式,讓我來好好的研究看看…

一拜神就中簽了:

http://lavag.org/topic/13342-get-a-cloo4labview-opencl-in-labview/

不過帖子裡有提到他當時的OpenCL只支援32bit單精度浮點

現在很多GPU已經硬體支援64bit運算 (NV Compute Capability 1.3以上)

所以貌似可以這樣打開這個封印:
http://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/cl_khr_fp64.html

AMD開鎖好像還多一行:
http://www.bealto.com/gpu-fft2_real-type.html

這帖講到Double Precision (DP) 相對於單精度(float) 掉速度的問題
NV消費卡會掉到剩1/8,AMD會掉到1/5,NV Sever卡會掉1/2 (這與理想值相同) 
http://forums.nvidia.com/index.php?showtopic=201921

所以若有雙精度的需求,配合硬體特性使用看來很重要了。