去年,英伟达 GPU 技术大会上,首席执行官黄仁勋在演讲中公布了新的 Pascal GPU 架构,第一款产品便是 Tesla P100。虽然没有提及消费级显卡,但是表示基于 Pascal 的 GTX 1080 将在几个月后发布。
在今年的 GPU 大会上,英伟达发布了最新的 GPU 架构 Volta。Volta 架构的第一款产品是 Tesla V100,将用于数据中心。Tesla V100 有两种,一种是通过英伟达专有的 NVLink 与服务器(或者其他 V100)互连的夹层卡(如下图所示);另一种是双宽 PCIE 卡。
V100 相比 P100,要大一些、更强悍、更具震慑力。芯片面积为 815mm,采用台积电先进的 12nm FinFET 工艺,拥有 210 亿个晶体管。
对这个一时间走红的 V100,我们如何理性看待?
对于台积电 12nm FinFET 工艺,只是 16nm FF 工艺的一个稍稍改进版。这在晶体管面密度方面,Volta 与 Pascal 近乎相同。工艺的改进,带来的优势主要在功率方面。不过,V100 的确是一个令人印象深刻的芯片。
Volta 独特之处在于包含了 640 个新增的张量核(Tensor Core)。Tensor Core 执行专门的矩阵运算。谷歌 TPU 以及 ASIC 对通用 AI 芯片造成威胁。英伟达的战略就是,将 TPU 融入自己的产品中,粗暴地将 TPU 作为一个专门的子处理器融合入其 GPU 中。Tensor Core 的速度非常快,相比 Pascal,速度提升了 5 倍。
Tensor Core 有助于提升推理处理的性能。英伟达声称 V100 在推理处理方面大约是 P100 的 3 倍,但是英伟达并没有与谷歌 TPU 进行对比。很明显,英伟达尽全力表现自己就是为了否定 TPU 以及 ASIC 的独特优势。
去年,英伟达推出 DGX-1 这个超级计算机,今年 DGX-1 已经升级为 DGX-1V,配备 Volta V100 和新的 NVLink 2.0(带宽为旧接口的两倍)。
02
在黄仁勋 GTC 2017 主题演讲中,也可以了解到下一代 PX 平台 Xavier 的细节。Xavier 性能表现的关键在于内置了 Volta GPU,而 Tensor Core 的存在使 Xavier 的高效能性得以实现。
自动去年 10 月英伟达 Drive PX 2 被特斯拉采用,英伟达逐渐建立起其在自动驾驶领域的地位,并获得了高速的发展与增长。
今年,英伟达似乎会加快 Xavier 在自动驾驶领域的部属。英伟达还宣布和丰田合作,丰田将采用英伟达 DRIVE PX 车载 AI 计算平台,并希望在 2020 年左右将自动驾驶车推向市场。
我相信英伟达在自驾车的处理器方面遥遥领先,汽车行业将或多或少将英伟达的处理平台作为标准。即便英特尔将 Mobileye 收入囊中,但似乎已经太晚了。
说了这么多,我对于英伟达的关注已经很久,我相信消费级基于 Volta 的产品也不会太遥远。
更多有关英伟达的资讯,欢迎访问 与非网英伟达专区
与非网编译内容,未经许可,不得转载!