nvidia的下一代geforce游戏卡迟迟不肯露面,一方面是缺乏足够的竞争刺激,另一方面则是nvidia的业务重心早已经转移,不再只盯着游戏卡,更关注的是计算平台,毕竟那里发展空间更大,利润也高得多。
nvidia今天宣布推出新一代计算平台“hgx-2”,拥有多达16块顶级计算卡tesla v100,而且第一次将ai人工智能、hpc高性能计算融合在了统一架构之内。
tesla v100基于新一代gpu架构“volta”(伏特),采用台积电12nm ffn(16nm加强版)工艺制造,拥有5120个cuda核心、640个tensor深度学习核心,面积达815平方毫米,集成了210亿个晶体管。
其浮点性能高达半精度30tflops、单精度15tflops、双精度7.5tflops,tensor性能则有120tflops,同时搭配4096-bit位宽的16gb hbm2高带宽显存,频率1.75ghz,带宽900gb/s。
nvidia此前的计算平台hgx-1整合了8块tesla v100,总计40960个cuda核心、5120个tensor核心、256gb显存,通过300gb/s双线带宽的nvlink总线相连,浮点性能单精度125tflops、双精度62tflops,tensor性能1pflops。
而新一代hgx-2则用上了16块tesla v100,规模和性能轻松翻番,总计81920个cuda核心、10240个tensor核心、512gb显存,浮点性能单精度250tflops、双精度125tflops,tensor性能2pflops。
nvidia还在系统内部署了12颗nvswitches开关,用于gpu之间的直接互联,nvlink总线双向带宽高达2.4tb/s。
除了高性能,hgx-2平台的最大优点是支持多种精度计算,可适应不同需求,比如在科学计算和模拟中,可使用fp64、fp32高精度计算,而在ai训练和推理中,则可使用fp16浮点、int8整数精度计算。
联想、超微、qct、wiwynn四大服务器厂商都将在今年晚些时候发售各自的hgx-2系统。
富士康、英业达、广达、纬创四大odm厂商则正在设计基于hgx-2的系统,将在今年晚些时候面世,可用于云计算数据中心。
如对本文有疑问, 点击进行留言回复!!
Q1全球PC出货下跌8%:2016年以来最惨 联想力压惠普第一
腾讯发布国内首款无服务器数据库:最快1秒完成部署 成本降低70%
小米有品上架Intel迷你主机:酷睿i5/i7 2699元起
微星全新SFF主机升级版Trident3曝光:升级9700F+GTX1660S
网友评论