最近,英伟达股价暴跌的新闻不绝于耳,11 月 15 日,公布 Q3 财报之后,股价更是一日蒸发两百多亿美元,从 10 月 1 日股价达到最高点 289.36 美元到 21 日休市前为 144.71 美元,不到两个月时间,下滑 50%,几乎拦腰折断。
再加上近日美国商务部工业安全局出台的一份针对关键新兴和基础技术和相关产品的出口管制框架,直捣 AI 技术、AI 芯片、机器人、量子计算等几项正在蓬勃发展的核心前沿技术。
无论是加密货币的热潮减退还是中美之间紧张的贸易关系,对于英伟达来说,都算不上好消息。
《华尔街日报》在最近报道里这样评价:“英伟达,一家硅谷的科技领军企业,正被迫在中美之间走钢丝。”
11 月 21 日,“被迫走钢丝”的英伟达 2018 年全球 GTC China 的最后一站在苏州召开。在如此特殊或者关键的时刻,大家很期待英伟达掌门人黄仁勋将会在这场技术盛会上带来哪些消息?
黄仁勋穿着一贯的皮夹克登台,“GTC China!大家,欢迎!”,全场欢呼。
在接下来的两个多小时里,黄仁勋站在英伟达的角度以“重塑计算机图形、重塑未来计算、AI 推动自动化”等部分为主题进行了演讲。
演讲内容和方向完美的诠释了英伟达作为一家高性能计算的 GPU 公司所拥有的经验实力和宏大愿景。
登台不久,黄仁勋宣布了首个支持 RTX 光线追踪的中国游戏——网易“逆水寒”以及首个支持 DLSS 深度学习超级采样加速的游戏——“西山居”。
RTX 开、关画面效果对比图
黄仁勋在台上 one more time 的演示着 RTX 技术让人眼前一亮的画面改善效果,通过 RTX 光线追踪技术的强大性能,计算机模拟光线的物理行为,渲染出栩栩如生的图像,使游戏画面的表现力达到了一个新高度。
效果惊叹之余无疑是对其背后核心技术的“炫耀”,英伟达在今年 8 月份推出 Turing(图灵),被黄仁勋称为“自 2006 年 CUDA GPU 发布以来的最大进步”,十年磨一剑,英伟达试图用图灵引领计算机图形技术实现新一轮的突破。其中,在 Tensor Core(全新张量核心)运行的神经网络模型 DLSS(超级采样)能将低像素图像处理为高清图像,让游戏和 CG 更加逼真动人。
此外,在 DLSS 帮助下,RTX 系列显卡的性能会获得 1.8 倍的提升,花 499 美元买个 2070,就能获得比 699 美元的 1080 Ti 更好的游戏性能。
颠覆“摩尔定律”者
“摩尔定律已经失效”,话锋急下也不失为黄仁勋演讲的另一种魅力。
黄仁勋话题直入“摩尔定律”,提到之前在相同功率或价格下,性能每 10 年,将会加速 100 倍,这是行业信以为真的基础。但如今,性能每年可能只增长 10%左右,最近几年受工艺制程影响,摩尔定律已经终结。其中还不忘揶揄一下老对手英特尔“挤牙膏”的方式。
英伟达作为“摩尔定律已经终结”的支持者和颠覆者,显然做了些准备。黄仁勋介绍了过去十年来,英伟达致力于开创加速计算,重新设计软件堆栈、优化整个芯片的架构、系统软件、算法、应用程序等各种方面。
要想在加速计算领域有所领先和推动,首先要有好的架构,保留架构的兼容性以及有一个能实现架构的庞大用户群。CUDA SDK 作为英伟达的架构,目前下载量已接近 1400 万,仅去年一年就达到 600 万。
在英伟达到处宣称“摩尔定律已经终结”的背后,是其试图引领加速计算时代的一种信号。在其引领加速计算的前进之路上,英伟达向我们展示走到了哪里。
GPU 加速平台 HGX-2
首先,黄仁勋抱上来了颇有分量的 HGX-2。
HGX-2
英伟达的 HGX-2 在单节点中能够提供 2 千万亿次的计算性能,与仅使用 CPU 的服务器相比,它将 AI 机器学习工作负载的运行速度提升近 550 倍,将 AI 深度学习工作负载的运行速度提升近 300 倍,将高性能计算工作负载的运行速度提升近 160 倍。
黄仁勋表示:“计算机产业领导者广泛采用 HGX-2,能够极大提升了人工智能研究人员、数据科学家和软件开发人员的工作效率,将迭代次数从几天减少到几小时。”
HGX-2 合作伙伴
据悉,目前华为、浪潮、联想、QCT、曙光、Supermicro 正在制造 HGX-2 计算机,百度和腾讯将提供基于 HGX-2 的云计算服务。
T4 云计算卡
紧接着,黄仁勋还介绍了其 T4 云计算卡。
T4 云计算卡
搜索、社交媒体和在线购物网站等互联网公司是 T4 的早期使用者,也是最大的终端客户群。
T4 基于全新 NVIDIA TuringTM 架构,采用多精度 Turing Tensor Core 和全新 RT Core,与加速的容器化软件堆栈相结合,提供规模空前的性能。
T4 的多精度功能可支持 4 种不同精度等级的各类 AI 工作负载,助力实现突破性的 AI 性能,FP32 精度能够提供 8.1 TFLOPS,FP16 精度能够提供 65 TFLOPS,INT8 精度能够提供 130 TOPS,INT4 精度能够提供 260 TOPS。
中国首批开始使用 T4 扩展并提升工作负载横向扩展的企业包括百度、腾讯、京东以及科大讯飞。中国领先的计算机制造商也将推出一系列基于 T4 的服务器,包括浪潮、联想、华为、曙光、浪潮商用机器和新华三等。
黄仁勋在现场演示了基于百度图片识别引擎的 demo,在使用 Intel Skylake 架构的纯 CPU 服务器时,运算速度只有 4~5fps,而换用 4 块 T4 计算卡后,运算速度飙升至 6200fps。在将计算卡数量增至 28 块时,运算速度也呈线性增长至 43500fps,可见其可扩展性非常优秀。
在分享完上述的计算加速硬件后,黄仁勋还介绍了开源的 GPU 加速平台 RAPIDS,RAPIDS 构建于 Apache Arrow、PANDAS 和 SKLEARN 等组件之上,通过 CUDF 数据过滤、CUML 机器学习、CUGRAPH 数据图像化来加速处理数据,这三套软件工具都是基于 CUDA 开发,可以把它们看成是 CUDA 的一部分。
RAPIDS 适用于大规模的数据分析和机器学习,让数据科学家首次能够在 GPU 上运行数据科学管线,并大幅缩短数据集处理时间,数据处理速度较仅用 CPU 提升 50 倍。
通过 RAPIDS 平台,英伟达能够让 GPU 加速计算应用到更多机器学习的算法与场景当中——在这些相对复杂的场景里,深度学习往往不足以完成任务,需要引入其他机器学习技术。
RAPIDS 目前已经被非常广泛的采用,比如华大基因、平安科技、碳云智能等中国公司都宣布引入它进行机器学习加速。
此外,英伟达在上周发布了 NGC-Ready 计划,让采用基于 NVIDIA GPU 的强大系统的客户能够在更广的范围内放心地部署 GPU 加速软件。在本次 GTC China 上,英伟达发布了更多来自中国的华为、浪潮、联想、曙光等领先计算机制造商的全新 NGC-Ready 系统。此外,搭载 NVIDIA Quadro GPU 的 NGC-Ready 工作站将为研究人员提供一个平台,为其提供快速构建、训练及开发深度学习项目所需的性能和灵活性。
自动驾驶能否成为英伟达回升的“命门”?
直到大会最后,自动驾驶领域作为英伟达潜在增长空间压轴出场。
距离 Xavier 的首次发布已经有近两年时间了。在本次 GTC 上,基于 Xavier,英伟达推出了一个新的产品阵容 DRIVE AGX(由 Drive PX 改名而来):面对 L2/L3 自动驾驶计算平台的 DIRVE AGX Xavier 和高性能的面对 L4/L5 自动驾驶计算平台的 DRIVE AGX Pegasus。在工业和机器人领域,则有了 Jetson AGX Xavier 产品套件。
AGX Xavier 是第一个专为处理机器人计算业务而设计的芯片,其功能强大,能够帮助下一代配送机器人需要在小型封装中实现大规模计算性能,包括多个高分辨率摄像头和激光雷达等的各种传感器必须感知周围世界,在复杂、动态的城市环境中进行本地化地路径规划和行驶。
本次 GTC 上宣布京东和美团已选用英伟达 Jetson AGX Xavier 平台,为其下一代自主配送机器人提供技术支持。目前,该开发者套件现已上市,售价为 1299 美元。
除了机器人之外,DRIVE 自动驾驶平台是英伟达重点关注的领域之一。
英伟达高性能的 Pegasus 无人出租车计算平台目前已经可以满足高等级自动驾驶的需求。今年 10 月,英伟达的无人车在其支持下,在硅谷完成了 50 英里的无人驾驶测试。
英伟达此次还推出自动驾驶系统平台 NVIDIA DRIVE AGX,目前,NVIDIA DRIVE 及 DRIVE 环境均已上市,黄仁勋本次宣布沃尔沃将采用英伟达的 DRIVE AGX 系列 AI 计算平台,为沃尔沃的下一代量产车型提供 L2 级驾驶系统。与此同时,小鹏汽车、奇点汽车、SF MOTORS 三家新公司也正式加入英伟达 DRIVE AGX 系列大家庭。
Roadstar.ai、moenta、图森等自动驾驶初创也将采用 DRIVE AGX Xavier 家族产品开发自动驾驶解决方案。
此外,英伟达还宣布与 FAW、满帮、plus.ai 合作,在 2021 年带来自动驾驶卡车。
自动驾驶的话题将黄仁勋的演讲推向高潮,随着矿机热度的消退和股价的暴跌,英伟达或许比任何人都期待自动驾驶市场的到来,在这段近乎折腰的动荡时间里,英伟达迫切需要找到新的出口,去转变和再度成长。
回顾英伟达暴涨的奇迹和暴跌的过程,不难发现,对市场的预估和判断对一家企业有着何其重要的影响。但于你我,不过就像是时间上演的一出戏剧,期盼在高潮之后看其结局。
于英伟达来说,作为本轮人工智能热潮的重要推动者、AI 红利的最大受益者之一,面对中国如此巨大的市场,越来越多的合作伙伴,无疑是一块大蛋糕,但随着中美贸易关系的紧张和局促,眼前的蛋糕看上去又显得若得若失。
高潮之后,灯光暗下,黄仁勋挥手离场。激昂了两个多小时的“黄教主”,在昏暗灯光的短暂遮蔽下,不知脸上是否会划过一丝疲倦和失落 ...
横在中美之间的这根“钢丝”,英伟达又该如何去走,尽管这根钢丝上并非他一人。
与非网原创内容,未经许可,不得转载!