当前位置：移动技术网 > 科技>办公>CPU > 英特尔公布Nervana NNP-T深度学习训练加速器 16nm工艺、32GB HBM2

英特尔公布Nervana NNP-T深度学习训练加速器 16nm工艺、32GB HBM2

2019年08月21日 | 移动技术网科技 | 我要评论

本文经授权转载，其它媒体转载请经超能网同意。

现在深度学习已成为人工智能的重要方向，而且研究成果已经应用于日常使用中。但训练人工智能模型需要强大的算力支持，所以除了使用gpu加速训练外，很多厂商开始推出专用于深度学习训练的asic芯片。英特尔在人工智能领域投入颇多，除了fpga产品线外，也推出了nervana深度学习加速器，在今天的hot chips 31会议中，英特尔公布了旗下nervana nnp-t深度学习加速器的细节。

这款nervana nnp-t深度学习加速器代号为spring cast，是目前英特尔最新款的专用深度学习加速器。这款加速器被命名为nnp-t，表示其主要用于深度学习网络模型训练工作定制。随着深度学习模型越来越庞大，所以专用的训练加速器也逐渐流行起来，如nvidia也推出了tesla t4 gpu。

具体到加速器核心上，此次英特尔反常的使用了台积电16nm cln16ff+工艺，而实际上nervana在收购前就使用的是台积电28nm工艺制造其第一代的lake cast芯片。虽然使用的是台积电的工艺，但也是用了很多台积电的最新技术。芯片采用了4个8gb hbm2-2400内存，每针脚2.4gb/s的传输速率，都安装在一个巨大的1200平方毫米的硅基板上。同时计算核心与hbm内存通过台积电最新的cowos晶圆级封装技术进行互联。最终得到了一个60 x 60mm，具有3325 pin的bga封装。

在展示中称此次由于hbm2与核心是无源封装，所以为2.5d封装技术。而hbm2由于是4hi,所以整体为3d封装。实际上英特尔自家也有emib嵌入式多芯片互联桥接这种桥接技术。四个hbm2堆栈共有64条serdes通道，每个通道支持28gb/s的传输速率。

具体的核心规模上，nervana nnp-t的计算核心拥有270亿晶体管，包括24个tensor processors（tpc）。除了tpc外，芯片裸片中还有60mb的sram以及一些专用的接口，如ipmi、i2c及16条pci-e 4.0通道。

芯片的工作频率为1.1ghz，风冷条件下功率配置为150w到250w，可通过水冷获得更强大的性能表现。同时nervana nnp-t加速器还拥有ocp卡及pci-e两种规格，以供数据中心选择。

nervana nnp-t加速器充分利用内存模块和互联网络使得计算核心得以充分使用。计算核心支持bfloat16矩阵乘法、fp32、bf16以及其他主要操作。同时在使用上英特尔已经通过开源的ngraph库将深度学习框架连接到硬件后端的编译器。现在英特尔正在与常见的paddle paddle、pytorch及tensorflow深度学习框架进行合作。

由于采用了可扩展架构集ocp及pci-e规格，所以对于数据中心等场景可以方便地进行扩展。架构支持扩展到1024个节点，每个节点拥有8个nnp-t计算核心。

英特尔表示他们将在今年年底向客户提供nnp-t的样品，主要针对以及云服务提供商，在2020年之前面向更多用户。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

2年升级一次 Intel：10nm、7nm及5nm工艺开发不会削减投资

在去年了量产10nm工艺之后，按计划intel将在2021年推出7nm工艺，5nm也会在2023年问世，回到之前的2年升级一次的周期。开发新工艺、提升新工艺产能... [阅读全文]
7nm锐龙4核CPU性能领先75% 主板厂商抓住救命稻草

2020年由于疫情的影响，最近除了笔记本电脑销量大涨之外，其他pc市场已经受到冲击，主板厂商都在发愁呢。不过amd刚刚发布的7nm锐龙3系列两款4核cpu及b5... [阅读全文]
AMD下一代锐龙APU实锤！Zen3、RDNA2绝配

amd renoir锐龙4000u/h apu处理器可以说是近些年来最完美的产品之一，全新的7nm工艺和zen 2架构，最多8核心16线程，热设计功耗覆盖15-... [阅读全文]
7nm追赶台积电3nm Intel的CPU工艺终归还是老大

2019年intel超越三星，夺回了全球半导体市场的一哥地位，过去27年以来intel在这个榜单上把持了25年之久。再下一步，intel... [阅读全文]
苹果自研Mac处理器曝光：5nm 12核

北京时间4月23日晚间消息，据国外媒体报道，多位知情人士今日称，苹果公司计划于明年开始销售搭载自家处理器的mac电脑。这些知情人士称，苹... [阅读全文]
Intel巨型插座转接卡曝光：3647针变4189针

很久很久以前，当处理器插座形态从slot转向socket的时候，曾经出现过转接卡这样一种特殊的产物，可以跨平台使用处理器和主板，但后来渐... [阅读全文]
AMD推土机FX-8350超频至8.1GHz！却打不过3.6GHz锐龙

“推土机”(bulldozer)可以说是amd处理器的一段“黑历史”，相当失败的处理器，... [阅读全文]
A饭雄起：“美国贴吧”用户数破40万

凭借锐龙处理器，amd这三年在cpu市场上风光无限，销量大涨，全球的a饭也多了起来。日前在被称为美国贴吧的reddit社区中，amd版块... [阅读全文]
7nm锐龙4000桌面APU曝光 CPU性能小惊喜

随着锐龙4000系列笔记本处理器的上市，amd现在的cpu产品线中还少最后一环——7nm zen2的锐龙apu桌... [阅读全文]
台积电加速研发2nm工艺：成本可轻松超10亿美元

这几年，天字一号代工厂台积电一路高歌猛进：7nm工艺上独步天下，5nm工艺也正在量产，3nm工艺就在不远处，2nm工艺也正在蓝图上铺开&... [阅读全文]

网友评论


验证码：

英特尔公布Nervana NNP-T深度学习训练加速器 16nm工艺、32GB HBM2

2019年08月21日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论