当前位置: 移动技术网 > 科技>办公>台式机 > 16块Tesla V100计算卡合体!NVIDIA造顶级计算平台

16块Tesla V100计算卡合体!NVIDIA造顶级计算平台

2019年01月12日  | 移动技术网科技  | 我要评论

nvidia的下一代geforce游戏卡迟迟不肯露面,一方面是缺乏足够的竞争刺激,另一方面则是nvidia的业务重心早已经转移,不再只盯着游戏卡,更关注的是计算平台,毕竟那里发展空间更大,利润也高得多。

nvidia今天宣布推出新一代计算平台“hgx-2”,拥有多达16块顶级计算卡tesla v100,而且第一次将ai人工智能、hpc高性能计算融合在了统一架构之内。

16块tesla v100计算卡合体!nvidia造顶级计算平台

tesla v100基于新一代gpu架构“volta”(伏特),采用台积电12nm ffn(16nm加强版)工艺制造,拥有5120个cuda核心、640个tensor深度学习核心,面积达815平方毫米,集成了210亿个晶体管。

其浮点性能高达半精度30tflops、单精度15tflops、双精度7.5tflops,tensor性能则有120tflops,同时搭配4096-bit位宽的16gb hbm2高带宽显存,频率1.75ghz,带宽900gb/s。

nvidia此前的计算平台hgx-1整合了8块tesla v100,总计40960个cuda核心、5120个tensor核心、256gb显存,通过300gb/s双线带宽的nvlink总线相连,浮点性能单精度125tflops、双精度62tflops,tensor性能1pflops。

而新一代hgx-2则用上了16块tesla v100,规模和性能轻松翻番,总计81920个cuda核心、10240个tensor核心、512gb显存,浮点性能单精度250tflops、双精度125tflops,tensor性能2pflops。

nvidia还在系统内部署了12颗nvswitches开关,用于gpu之间的直接互联,nvlink总线双向带宽高达2.4tb/s。 

16块tesla v100计算卡合体!nvidia造顶级计算平台

除了高性能,hgx-2平台的最大优点是支持多种精度计算,可适应不同需求,比如在科学计算和模拟中,可使用fp64、fp32高精度计算,而在ai训练和推理中,则可使用fp16浮点、int8整数精度计算。

联想、超微、qct、wiwynn四大服务器厂商都将在今年晚些时候发售各自的hgx-2系统。

富士康、英业达、广达、纬创四大odm厂商则正在设计基于hgx-2的系统,将在今年晚些时候面世,可用于云计算数据中心。

16块tesla v100计算卡合体!nvidia造顶级计算平台

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网