首页 文章

关于CUDA的架构(SM,SP)

提问于
浏览
3

我是一个刚刚开始CUDA编程的人 .
似乎有SP SM和CUDA架构的概念 .
我试着运行样本源的deviceQuery.cpp我觉得什么有效,SP SM开发他们的环境,
已经不知道哪个项目SP是否是SM中的任何项目 .

我认为项目"(14) Multiprocessors, (8) CUDA Cores / MP"对SP和SM都是如此,但我会正确理解以下内容?

SM =多处理器= 14 SP = CUDA核心/ MP = 8 CUDA核心= 14 * 8 = 112

顺便说一下,deviceQuery.cpp的结果如下 .

CUDA设备查询(运行时API)版本(CUDART静态链接)检测到1个CUDA功能设备设备0:“GeForce GTS 240 CUDA驱动程序版本/运行时版本5.5 / 5.5 CUDA功能主要/次要版本号:1.1总量全局内存:1024 MBytes(1073741824字节)(14)多处理器,(8)CUDA内核/ MP:112 CUDA内核GPU时钟频率:1620 MHz(1.62 GHz)内存时钟速率:1100 Mhz内存总线宽度:256位最大纹理尺寸大小(x,y,z)1D =(8192),2D =(65536,32768),3 D =(2048,2048,2048)最大分层1D纹理尺寸,(num)层1D =(8192),512 layers最大分层2D纹理大小,(num)层2D =(8192,8192),512层常量内存总量:65536字节每块共享内存总量:16384字节每块可用寄存器总数:8192翘曲大小:32每个多处理器的最大线程数:768每个块的最大线程数:512线程块(x,y,z)的最大尺寸大小:(512,512,64)最大尺寸大小网格大小(x,y,z):( 65535,65535,1)最大内存间距:2147483647字节纹理对齐:256字节并发副本和内核执行:是1副本引擎内核运行时限制:是集成GPU共享主机内存:否支持主机页锁定内存映射:是Surfaces的对齐要求:是设备具有ECC支持:已禁用设备支持统一寻址(UVA):无设备PCI总线ID / PCI位置ID:9/0计算模式:<默认(多个主机线程可以使用:: cudaSetDevice()与设备模拟)>

1 回答

  • 6

    根据this你是对的:

    SM =流式多处理器

    SP =流处理器= CUDA核心

    总SP / CUDA核心数量= SM数量*每个SM的SP / CUDA核心数量

相关问题