当前位置: 移动技术网 > 科技>硬件教程>显示器 > AMD全新Vega(织女星)显卡架构首次公开:革命性的四大亮点

AMD全新Vega(织女星)显卡架构首次公开:革命性的四大亮点

2020年09月16日  | 移动技术网科技  | 我要评论
AMD全新Vega(织女星)显卡架构首次公开:革命性的四大亮点AMD表示,虽然Vega、Polaris相隔不到一年,但是变化非常大,可以说是GPU图形行业五年来最大的变化,拥有革命性的四大亮点,Vega的设计理念,来源于如今的GPU架构已经不能很高效地处理... 17-01-06

ryzen(zen)处理器秀了多次之后,终于轮到amd在显卡方面的重磅新品登场亮相了,这就是全新设计的vega(织女星)架构,定位高端,将成为amd未来旗舰和高端显卡的基石。

amd表示,虽然vega、polaris相隔不到一年,但是变化非常大,可以说是gpu图形行业五年来最大的变化,拥有革命性的四大亮点。

不过这一次,率先公开的只是vega架构上一些整体的设计特点,更深入的技术和规格细节还要再等等。

vega的设计理念,来源于如今的gpu架构已经不能很高效地处理最新的数据和负载需求,尤其是显存/内存架构远远跟不上计算需求的脚步。

为此,amd vega设计了世界上最高效、最灵活的gpu显存/内存架构,不像以往那样暴力提升显存频率或位宽来获得更大带宽,而是改变了gpu对于数据的传输处理方式。

注意,图中的芯片和线路布局只是示意性的,不代表实际芯片的样子。

首先是高带宽缓存(hbc)主要就是用上了第二代高带宽显存hbm2,单位带宽是第一代的2倍达到2gbps/pin,堆叠容量则是8倍达到8gb,同样和gpu整合在一块基板上(当然互联层做了升级),占用面积相比gddr5小了超过50%。

vega还特意设计了高带宽缓存控制器(hbcc),但不仅仅是管理hbm2,还负责沟通系统内存、非易失性存储(nvram)、网络存储。

hbcc的最大虚拟寻址空间高达512tb,可以有效管理超大数据集,amd称之为适应性精细调节数据转移。

amd还举了两个例子(是游戏而非专业应用),展示了《巫师3》、《辐射4》的显存占用情况,其中大约一半都被浪费了,也就是管理效率很低,而这正是vega要解决的。

第二点,vega拥有新的可编程几何流水线每时钟周期峰值吞吐量翻了一番,可通过4个几何引擎处理最多11个三角形。

同时,vega的几何引擎还加入了原语着色器(primitive shader),一个新的着色器阶段,和圆通的顶点、集合着色器引擎路径并行,可以高速抛弃隐藏的、没必要的原语。

载入均衡也得到了改进,vega通过智能工作组分配器,可以高效率地为计算引擎、几何引擎、像素引擎分派不同的任务负载。

第三点,下一代计算引擎单元(ncu)这也是gcn架构引入以来最大规模的底层革新,每时钟周期可以处理512个8位或者256个16位或者128个32位操作,尤其是可以在单个fp32 alu内处理一对fp16浮点操作,如果彼此兼容的话就可以打包到一起作为fp32进行处理,由此带动峰值吞吐能力翻番。

同时,寄存器还可以把一个fp32拆分成两个fp16,载入存储指令也可以转移fp16。

vega仍然有64个alu,fp32每时钟周期操作数128个也和gcn一样,但没有介绍具体是如何组织的。

vega ncu同时针对高频率、高ipc都进行了优化,都有利于提升gpu综合性能。

ncu还可以同时进行计算和图形处理,并且能够根据负载不同而变换simd单元宽度,结果就是以往需要多个计算单元才能完成的任务,现在只需一个就能搞定,不会造成浪费。

最后一点是下一代像素引擎,可以提出无效的渲染单元,在片上高速缓存内执行光栅化,同时打破了以往架构像素和纹理访问的不一致,实现硬件存储一致性,也就是各级缓存的数据都是最新的,二级缓存统一为渲染后端服务。

这就是vega gpu初步披露的架构设计,重点就是革命性的高带宽缓存、新的可编程几何引擎、下一代计算单元、高级像素引擎。

至于更深入的底层架构设计,以及整体规格,以后再说。

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

相关文章:

验证码:
移动技术网