首页 文章

CUDA - 更多SM或更高的时钟频率?

提问于
浏览
0

当CUDA内核速度执行至关重要时,更重要的是什么?核心的频率或SM的数量?

我可以在Quadro K5000和Gtx 670之间进行选择,我无法决定 . 在两种情况下内存似乎都足够了,但是quadro有更多的SM,而Gtx有更高的时钟频率(我想这个值是每个核心) .

2 回答

  • 2

    取决于你想要执行的内容 . 您的程序是否会使用Quadro的所有内核?如果没有,Gtx会更快 . 如果它和Gtx需要超过1格,你应该做数学,但Quadro可能会更快 .

  • 2

    Quadro K5000和GTX670都基于相同的GK104芯片 . Quadro在GTX470上有8个SM而不是7个 . GTX670的运行速度为915Mhz,而Quadro的运行速度为706Mhz,因此GTX670的整体吞吐量更高 . Quadro的带宽为172GB / s,而GTX670的带宽为192GB / s,因此GTX670的带宽也更好 .

    如果决定完全基于速度,请使用GTX670 . 如果预算允许,您可能还需要考虑GTX780或Titan .

    选择哪个GPU卡及其原因的问题将在this textbook的第11章中介绍 .

相关问题