1
dingyaguang117 2013-11-01 15:52:21 +08:00 1
应该是内存到显存对拷的时候比较慢吧,感觉本来没有什么运算,这样拷进去比较一下,再拷出来 肯定慢
|
2
madeye 2013-11-01 15:57:26 +08:00 2
建议贴出代码,我这儿有全套环境帮你做 Perf tuning。
另外一个开源的 CUDA grep 见这里: http://bkase.github.io/CUDA-grep/finalreport.html |
3
msg7086 2013-11-01 19:28:32 +08:00 1
显卡强在并行密集运算,用途不太合适。
|
4
haoji OP |