当前位置：移动技术网 > IT编程>开发语言>.net > cuda程序以及硬件的映射

cuda程序以及硬件的映射

2020年09月29日 | 移动技术网IT编程 | 我要评论

一个网格中，多个块，每个块的大小和维度是一样的，每个线程--->cuda core或者 sp(stream processor)block-->SM。SM 可以调度多个线程块，一个kernel 的各个线程块被分配多个SM, grid 是逻辑层，SM 是执行的物理层。每个SM 有自己的共享内存、寄存器 ,L1 cache 以及其他功能的硬件。一个程序的块不能被映射到不同的SM上，一个block 只能被一个SM调度。SM 采用 SIMT采用单指令多线程的架构（将多维t...

一个网格中，多个块，每个块的大小和维度是一样的，每个线程--->cuda core或者 sp(stream processor)

block-->SM。

SM 可以调度多个线程块，一个kernel 的各个线程块被分配多个SM, grid 是逻辑层，SM 是执行的物理层。每个SM 有自己的共享内存、寄存器 ,L1 cache 以及其他功能的硬件。一个程序的块不能被映射到不同的SM上，一个block 只能被一个SM调度。

SM 采用 SIMT采用单指令多线程的架构（将多维thread 排成一维），是以wrap为最小的调度单位，每个线程有独立地址计数器，也有寄存器状态，以及独立的执行路径。线程束中的线程从同一程序地址开始执行，但是可能会遇到不同的分支路径，另外一些线程可能不执行，只能进入等待状态。线程束的分化会造成程序性能的下降。

每个wrap中使用的内存、寄存器资源不能太多，否则，每个Sm上处于活跃状态的wrap会比较少。block 的大小一般设为32的倍数。

本文地址：https://blog.csdn.net/xieshangxin/article/details/108868568

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

相关文章:

MT8768芯片资料技术详细解析，MT8768核心板简介

MT8768芯片资料技术详细解析，MT8768核心板简介MT8768核心板简介：MTK8768安卓核心板是联发科... [阅读全文]
广州公司笔/面经

总结一下这几天的面试吧！从19号到现在总共笔/面了，长亮科技（offer）、荔枝FM（在确定部门和薪资）、涂鸦智... [阅读全文]
Unity打包ARCore程序踩过的坑

个人纪录Unity打包ARCore程序踩过的坑首先一定要挂梯子，因为新的ARCore要求高版本的gradle，U... [阅读全文]
Android Q网络状态判断，亲测可用

package com.example.androidinterviewjxd.utils;import and... [阅读全文]
Android 进阶——Framework 核心 Android Storage Access Framework（SAF）存储访问框架机制详解（一）

Android Storage Access Framework（SAF）存储访问框架机制详解 ... [阅读全文]
永不停歇的引擎-异常处理

最近发现了之前写的一篇博客，和这个类似，大家可以参考着看。事件太久了，我都忘记还有另外一个博客地址了。https... [阅读全文]
ASP.NET Core使用静态文件、目录游览与MIME类型管理

ASP.NET Core使用静态文件、目录游览与MIME类型管理Startup管道配置中,可以看到,注入相关静态... [阅读全文]
Android二维码生成与扫码

一、生成二维码注意：hint不要使用模板，若填写的value为String可能会抛异常。在gradle中加入依赖... [阅读全文]
2020-09-22

Activity KEEP_SCREEN_ON原理我们都支持如果要保持activity界面常亮，在activit... [阅读全文]
Android 两种动态获权的方法？

一、自定义动态获权1.创建BaseActivity，将动态获权代码进行编写package com.ruidde.... [阅读全文]

网友评论


验证码：

移动技术网