当前位置：移动技术网 > 科技>办公>CPU > CPU浮点运算和整点运算分别决定其什么性能？

CPU浮点运算和整点运算分别决定其什么性能？

2019年03月06日 | 移动技术网科技 | 我要评论

本文转载自，其他媒体转载须经超能网同意。

简单来讲在现代计算机环境下的日常使用中，整点运算性能影响如压缩与解压缩，计算机进程调度，编译器语法分析，计算机电路辅助设计，游戏ai处理类型的操作。

而浮点运算单元主要影响cpu的科学计算性能，如流体力学，量子力学等，而更贴近我们日常能见到的应用就是多媒体相关的应用，如音视频的编解码，图像处理等操作。

zen的核心架构图

而我们通常在测试cpu时使用如sandra 2018，super pi,wprime，fritz chess benchmark，winrar，7-zip，x264 fhd benchmark等软件，这些测试软件就能够体现处理器理论整数运算单元和浮点运算单元性能的。

在具体使用的软件中，如压缩解压软件winrar，7-zip，程序员使用的gcc编译器，网络路由的选择，游戏中的ai以及我们日常试用操作系统调度都是整点运算。而我们在使用lightroom等图像处理软件，语音识别，视频的编解码，以及科学家使用matlab进行科学计算时都用到了浮点运算能力。

对于玩家最关心的就是这些到底对游戏有什么影响。首先cpu承担着整个计算机中的任务进程分配问题，所以如果游戏代码优化不好，进行频繁的draw call操作，会非常消耗cpu任务调度资源。同时现在游戏ai做操作行为判断时，也是使用整点运算单元的。而现在很多游戏加入了防盗版机制，在运行游戏时频繁的加解密会消耗浮点运算性能。所以有朋友使用较老的硬件运行新游戏时，会非常影响游戏运行帧率。

所以整点运算性能和浮点运算性能都反映了cpu处理数据的能力。但是整点运算性能还反映了控制程序流的的能力。

在计算机中，定点数不一定是整数，而浮点数也不一定是小数。在计算机中，定点数是指小数点固定的数，而浮点数是指小数点不固定的数。在计算机中采用ieee 754标准进行浮点数的存储的，他可以精确的的表示某一个数据。

在早期浮点运算单元并没有一开始就加入到cpu设计中的。但是在计算机中，运算单元都是逻辑电路，由浮点数的定义我们可以知道，在早期仅有整点数运算单元而不带有浮点数处理单元的处理器上，处理浮点数的阶码、尾数的计算以及规格化就成为了很困难的事情，导致早期cpu在科学计算中依旧非常的缓慢。所以intel就设计了独立于8086和8088处理器外的8087数学辅助处理器。到后来随着计算机不再是科学家的工具，也逐渐进入了公众视野，intel在80486dx处理器核心内首次集成了浮点运算单元。

intel 8087协处理器

cpu浮点运算和整点运算分别决定其什么性能？
intel core i7 7700k处理器的cpu-z信息

早期的intel x87系列数学运算辅助处理器只是作为一个提高浮点运算速度的处理器，而在现代处理器中，浮点计算功能会通过simd（single instruction multiple data，单指令多数据流）的技术实现并行计算能力。在打开cpu-z后，开支持指令集一栏可以看到，现代处理器带有的sse指令集就有处理浮点运算的能力。而在之后的发展中，也逐渐引入了sse2，sse3，sse4，avx，fma等更加适用于现代软件开发的拥有强大浮点运算能力的指令集。

那接下来就有问题了，现代处理器加入了很多高度并行化的浮点运算单元，相较以往单纯cpu的浮点运算能力有了非常大的飞跃，但是相对于现代的图形处理器来说，这么些浮点运算能力是不够看的，那为什么不像几十年前一样不在cpu中集成浮点运算单元呢？？

nvidia geforce 256核心照片

对于这个问题，首先大家要了解为什么会独立出来图形处理器这种专有硬件的。在20世纪90年代，计算机多媒体逐渐开始兴盛起来，在1998年到1999年间，intel和amd的cpu中已经拥有了sse或3dnow！这样的simd浮点运算指令集。但是随着电子游戏的发展，计算机的使用者对于计算机的图形性能有了更高的要求，但是此时的cpu内浮点运算性能并不满足需求，所以在此后图形处理器开始负担更多的浮点运算工作。

cpu浮点运算和整点运算分别决定其什么性能？
nvidia cuda核心工作流程

但图形处理器的使用者看到如此高效能的浮点运算处理器的时候就在思考如何能让这类设备承担除了图形计算之外的浮点计算性能。乘着gpgpu（general-purpose gpu）概念的逐渐兴起，显卡上的统一渲染架构的出现，也让这种计算方式真正成为现实。nvidia在2007年正式发布了cuda并行计算平台。之后也出现了如opencl的通用计算api（应用程序编程接口）。

到此我们突然发现，gpu都来抢cpu的浮点运算饭碗了，但为什么cpu非但没有取消浮点运算单元，反而其浮点运算性能越来越强？？

cpu浮点运算和整点运算分别决定其什么性能？
amd推土机架构示意图

其实并不是没有人想到这样的情况，而是已经与产品这么做了，就是amd的推土机架构。这个架构放弃了之前的一个核心就由一套整数运算单元和浮点运算单元的组合，而是让两个核心共享一个浮点运算单元组成一个簇，而amd将这种架构叫做cmt，又称为群集多线程技术，之后又将相对与intel有优势的gpu核心集成进cpu中，产生了apu处理器。

amd当时还为此成立了hsa基金会，为解决cpu和gpu的内存统一寻址问题，也提出了huma技术并用在了sony的ps4游戏机上。

sony playstation 4主机，cpu和gpu共享8gb gddr5内存

那为什么厂商做了这么多还是做不到用大规模的gpu取代cpu中的浮点运算单元呢？运算精度才是重点。cpu中的浮点运算单元是为了更高精度浮点运算准备的。如在最新intel处理器中的avx指令集可以处理512位扩展数据，这样大大提升了计算精度和速度。而gpu中的处理器都是为高度并行计算而设计的结构相对简单的核心，这些核心每一个都是simd处理器，但是能够处理的数据精度是有限的，在nvidia以及amd图形处理器上支持的数据精度大多是单精度和双精度浮点计算（fp32和fp64），甚至随着机器学习，深度学习，神经网络的流行，最新的图形处理器甚至支持了半精度浮点运算（fp16）。

其次，由于在计算精度上相较于cpu中的浮点运算单元不高，所以在这些处理器中也没有内置数据校验和数据补偿处理的运算单元。所以对于使用gpu进行科学计算的人，需要在编程阶段就避免这样的问题。同时cpu和gpu在设计上就是非常不同的，cpu的浮点单元个数很少，但是单个浮点运算单元所提供的性能是很强的。而gpu中是用过海量的simd单元堆砌出来的浮点运算能力。在cpu设计时，还需要设计大量的多级缓存来提高cpu的运算速度。而gpu中通常只为这些simd处理单元内置不多的缓存，而提供大量的内存（显存）。

所以综合上面的分析，我们可以得出的结论是虽然gpu拥有更强大的浮点运算性能，但是限于其计算单元的设计，统一内存架构的设计，其还是不能完全取代cpu中的浮点运算核心。cpu中的整点运算单元在肩负着如压缩解压，编译器编译程序，网络路由，控制程序流等任务同时，其浮点运算核心也依旧在处理着图像处理，科学计算等需要更高精度计算的任务。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

2年升级一次 Intel：10nm、7nm及5nm工艺开发不会削减投资

在去年了量产10nm工艺之后，按计划intel将在2021年推出7nm工艺，5nm也会在2023年问世，回到之前的2年升级一次的周期。开发新工艺、提升新工艺产能... [阅读全文]
7nm锐龙4核CPU性能领先75% 主板厂商抓住救命稻草

2020年由于疫情的影响，最近除了笔记本电脑销量大涨之外，其他pc市场已经受到冲击，主板厂商都在发愁呢。不过amd刚刚发布的7nm锐龙3系列两款4核cpu及b5... [阅读全文]
AMD下一代锐龙APU实锤！Zen3、RDNA2绝配

amd renoir锐龙4000u/h apu处理器可以说是近些年来最完美的产品之一，全新的7nm工艺和zen 2架构，最多8核心16线程，热设计功耗覆盖15-... [阅读全文]
7nm追赶台积电3nm Intel的CPU工艺终归还是老大

2019年intel超越三星，夺回了全球半导体市场的一哥地位，过去27年以来intel在这个榜单上把持了25年之久。再下一步，intel... [阅读全文]
苹果自研Mac处理器曝光：5nm 12核

北京时间4月23日晚间消息，据国外媒体报道，多位知情人士今日称，苹果公司计划于明年开始销售搭载自家处理器的mac电脑。这些知情人士称，苹... [阅读全文]
Intel巨型插座转接卡曝光：3647针变4189针

很久很久以前，当处理器插座形态从slot转向socket的时候，曾经出现过转接卡这样一种特殊的产物，可以跨平台使用处理器和主板，但后来渐... [阅读全文]
AMD推土机FX-8350超频至8.1GHz！却打不过3.6GHz锐龙

“推土机”(bulldozer)可以说是amd处理器的一段“黑历史”，相当失败的处理器，... [阅读全文]
A饭雄起：“美国贴吧”用户数破40万

凭借锐龙处理器，amd这三年在cpu市场上风光无限，销量大涨，全球的a饭也多了起来。日前在被称为美国贴吧的reddit社区中，amd版块... [阅读全文]
7nm锐龙4000桌面APU曝光 CPU性能小惊喜

随着锐龙4000系列笔记本处理器的上市，amd现在的cpu产品线中还少最后一环——7nm zen2的锐龙apu桌... [阅读全文]
台积电加速研发2nm工艺：成本可轻松超10亿美元

这几年，天字一号代工厂台积电一路高歌猛进：7nm工艺上独步天下，5nm工艺也正在量产，3nm工艺就在不远处，2nm工艺也正在蓝图上铺开&... [阅读全文]

网友评论


验证码：

CPU浮点运算和整点运算分别决定其什么性能？

2019年03月06日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论