NVIDIA RTX 3080显卡怎么样 NVIDIA RTX 3080显卡详细评测_显卡

在9月2日的发布会中，黄仁勋先生不止一次强调了“这是有史以来最伟大性能提升”。而从发布会展示的效果来看，rtx 30系显卡用双倍加量不加价来形容都不为过。并且第二代rtx的ampere架构所带来最直接的变化就是在性能方面暴涨，所以发布会前的种种烟雾弹也就显而易见了，下面笔者就给大家带来nvidia geforce rtx 3080的首发评测。

01 nvidia geforce rtx 3080 外观

下面我们先来看看这次nvidia rtx 3080 显卡的外观，首先在外包装上，一向是nv的极简风格，方方正正的硬纸盒子，主色调以黑色为主，辅以玫瑰金色纹路，而这次nvidia也罕见的没有用绿色，整体看起来有点像tesla v100。

双倍加量不加价 nvidia rtx 3080显卡首测

外包装与显卡

入手显卡之后，给人的第一感觉就是质感极强，堪称工业设计典范。在发布会当中我们也看到此次的rtx 30系显卡在外观方面做了极大改变，卡身大面积被散热鳍片覆盖。

而在拿到显卡后，我居然发现所有散热鳍片上都有哑光涂层，所以触感更偏温润。而显卡的外壳部分，采用了大面积的金属包裹，表面为磨砂材质。

双倍加量不加价 nvidia rtx 3080显卡首测

散热鳍片全部采用了哑光涂层

nvidia这款rtx 3080拿在手里给人的第一感觉就是——完美。这绝对是件艺术品，虽然以往在公版评测的时候我们都会惊叹其做工精致，但像这次如此巧妙地将大面积的金属融合在一起，形成刚柔并济，绝对在设计之初下了很大功夫，而这种效果弄不好就会成为一个“铁疙瘩”。

双倍加量不加价 nvidia rtx 3080显卡首测

geforce rtx 3080外观展示

之所以rtx 30系显卡的外观需要大改，是因为在散热方面同样做了颠覆性的设计。它采用了双轴流式设计，rtx 3080主动散热的风扇为一前一后，根据官方数据，空气流量相较于之前的设计增加55%，散热效率提升30%，静音效果提升至3倍。

nvidia 30系显卡发布会你需要了解这些

散热系统示意

具体的工作原理如上图所示，这也是nvidia显卡第一次将散热系统与机箱整体散热结合，形成协同工作。

双倍加量不加价 nvidia rtx 3080显卡首测

散热系统工作原理

新的散热系统，可以吸入外部的冷空气，流经gpu，并将热空气直接从机箱背部排出。另一个背面拉动式风扇同样吸入冷空气，但流经热管上的散热鳍片，并通过机箱整体的散热系统引导至机箱背部排出。

双倍加量不加价 nvidia rtx 3080显卡首测

pcb版对比

在显卡内部的pcb板上nvidia也做了非常大的调整，为了搭配新的散热系统，此次采用了超高密度的pcb板设计，前端为“v”字造型，体积较之前缩小了50%。

从图中可以看到板子上密密麻麻的元件排布，中间为rtx 3080的核心，四周分布10颗显存颗粒，同时还有两个空焊位置。

双倍加量不加价 nvidia rtx 3080显卡首测

geforce rtx 3080 pcb大图

18相供电依次排列在芯片左右两侧，钽电容分布在边边角角的位置。另外供电接口可以看到位于整块板子的右上方，其空间也真的只能容纳下单接口了，可以说整块pcb板几乎没有任何富裕位置。

双倍加量不加价 nvidia rtx 3080显卡首测

内附的供电转接线

由于本次公版显卡采用了单12pin的供电接口，为了方便适配玩家现有的电源，包装内还附带了一根转接线，可以将单12pin专为8+8pin，不过由于接口的方向设计，会正好挡住“geforce rtx”的信仰logo，略微有些瑕疵。

02 nvidia ampere架构带来的变化

下面我们就来看看，“有史以来最伟大性能提升”相比第一代的rtx turing架构，nvidia ampere会有哪些变化吧。

双倍加量不加价 nvidia rtx 3080显卡首测

第一代rtx架构 turing

双倍加量不加价 nvidia rtx 3080显卡首测

第二代rtx架构 ampere

首先来简单回顾一下在9月2日发布会的ppt上我们都看到了什么，相较于初代的turing rtx架构，nvidia ampere架构在算力上有着成倍的增长，每个时钟执行2次着色器运算，而turing为1次，着色器性能达到30 tflops单精度性能，而turing为11 tflops。

nvidia ampere架构翻倍了光线与三角形的相交吞吐量，rt core达到58 rt tflops，而turing为34 rt tflops。

另外在全新的tensor core中，可自动识别并消除不太重要的dnn权重，处理稀疏网络的速率是turing的两倍，算力高达238 tensor tflops，而turing为89 tensor tflops。

nvidia 30系显卡发布会你需要了解这些

芯片说明

全新的nvidia ampere gpu核心拥有280亿个晶体管，628平方毫米的面积，基于三星的8nm nvidia定制工艺，来自美光的gddr6x显存，以及我们上面说的，三大处理核心均为初代turing的两倍速率，构成了有史以来性能最强大的ampere。

而nvidia ampere架构的强大性能并不是nvidia一蹴而就，可以说在20系显卡中所采用的turing架构功不可没，下面我们先来看看完整的ga102核心。

双倍加量不加价 nvidia rtx 3080显卡首测

完整的ga102核心

完整的ga102 gpu包含7个gpc（图形处理集群）42个tpc（纹理处理集群）以及84个sm（流处理器）组成。gpc是占据主导地位的高级模块，拥有所有的关键图形处理单元，每个gpc包含一个专用光栅引擎。在新的nvidia ampere架构中，每个gpc还包含了两个rop分区，每个分区包含8个rop单元。下面我们来看看每个sm单元的变化。

双倍加量不加价 nvidia rtx 3080显卡首测

sm详解

在每个sm中，包含四个大的处理分区共128个cuda核心，4个第三代tensor core，1个第二代rt core，1个256 kb的缓存文件，1个128 kb的l1缓存，这个l1缓存可以根据不同的工作需求来调配缓存，工作效率发挥至最大。

另外大家都知道本次rtx 3080的cuda数量暴增至8704个，而rtx 3090的cuda数量更是达到了惊人的10496个，但是大家要知道专业计算卡tesla a100的ga100核心，拥有更大的核心面积，更多的晶体管数量，理论上只有8192个cuda，那rtx 3080又是如何达到这种效果的呢？

其实是因为本次nvidia ampere的sm在turing基础上增加了一倍的fp32运算单元，这就使得每个sm的fp32运算单元数量提高了一倍。

双倍加量不加价 nvidia rtx 3080显卡首测

完整的geforce rtx 3080核心

而通常我们计算显卡的cuda数量，并不是把sm中的所有单元加起来计数，而是只统计fp32单元的数量，所以这样一来答案就显而易见了，sm中的fp32 : int32 从 1:1 变为 2:1，如rtx 3080的8704个cuda，其实它只有4352个int32单元，但由于内部的fp32数量翻了一倍，所以最终实现了8704这个惊人的数字。

不过这样究竟算不算“虚标”？其实对于现在的游戏来说，浮点运算相比整数计算要常用的多，所以翻倍的fp32真的能带来性能翻倍的提升。

双倍加量不加价 nvidia rtx 3080显卡首测

光追工作原理示意

在此次的nvidia ampere架构中，nvidia官方宣布为第二代rt core，它和第一代有什么不同呢。首先要知道rt core的工作原理是，着色器发出光线追踪的请求，交给rt core来处理，它将进行两种测试，分别为边界交叉测试（box intersection testing）和三角形交叉测试（triangle intersection testing）。基于bvh算法来判断，如果是方形，那么就返回缩小范围继续测试，如果是三角形，则反馈结果进行渲染。

而光线追踪最耗时的正是求交计算，因此，要提升光线追踪性能，主要是对两种求交（bvh/三角形求交）进行加速。

双倍加量不加价 nvidia rtx 3080显卡首测