要開始研究opencl了。
雖然之前寫了cuda有一點點經驗,而且opencl跟cuda的架構相似。
沖著你opencl是開放格式,讓我來好好的研究看看…
一拜神就中簽了:
不過帖子裡有提到他當時的OpenCL只支援32bit單精度浮點
現在很多GPU已經硬體支援64bit運算 (NV Compute Capability 1.3以上)
所以貌似可以這樣打開這個封印:
AMD開鎖好像還多一行:
這帖講到Double Precision (DP) 相對於單精度(float) 掉速度的問題
NV消費卡會掉到剩1/8,AMD會掉到1/5,NV Sever卡會掉1/2 (這與理想值相同)
所以若有雙精度的需求,配合硬體特性使用看來很重要了。