数据是信息社会的基础,它是二进制世界的硬通货,也是驱动数字经济发展的动力之源。信息技术归根到底就是如何采集、传输和处理数据的技术,近几十年引领科技进步的商业公司前赴后继所从事的,基本都是如何从恒河沙数的数据中炼金的工作,英特尔也不例外。
数据洪流
“英特尔永远是一个处理数据的公司,”英特尔全球副总裁兼中国区总裁杨旭说道。在 2016 英特尔人工智能论坛上, 杨旭发表了《人工智能在中国》的主题演讲,他表示英特尔公司多年来持续跟踪数据处理技术的发展,全面布局数据处理核心领域,认真应对数据特征变化。他认为,人工智能的再次火爆,正是由于汹涌而来的数据洪流达到了一定“水位”所催生。
以 1956 年在达特茅斯学院举行的人工智能会议为起点,现代人工智能技术已经问世六十年,起起伏伏的人工智能产业并非一帆风顺。以往人工智能技术所取得的成就在学术与研究上的意义更大,产生的直接经济效益并不明显,杨旭就认为人工智能产业仍处于婴儿期。“人工智能还没有产生很多直接的经济效益,”英特尔公司副总裁兼数据中心事业部数据中心解决方案部门总经理 Jason Waxman 也这么说,“但所有的行业都能利用人工智能技术创造更大的经济效益,只是时间上早晚的问题。”
英特尔公司副总裁兼数据中心事业部数据中心解决方案部门总经理 Jason Waxman
越来越多的证据表面,当前的计算能力、算法与联网设备所产生的数据量已经构成了人工智能真正崛起的基础。除了在围棋领域战胜人类冠军,在图像识别和语音识别正确率上,机器性能也在近年超过了人类平均水平,这既是算法改进的功劳,又离不开大量的训练数据和计算。
在图像识别上机器已经超越人类水平
海量接入的联网设备所造成的数据洪流究竟有多大?“‘人联网’时代,我们使用手机、电脑等终端设备,每人平均每天产生 1.5 GB 的数据量。而到了物联网时代,一家智能医院每天产生 3,000 GB 的数据量,一辆无人驾驶汽车每天产生 4,000 GB 的数据量,一家智能制造工厂每天将产生 1,000,000 GB 的数据量,完全不可想象的庞大数据流正在产生。”
杨旭同时强调,大数据时代中国在很多领域都非常领先,“中国互联网用户数达到了 4.2 亿,全球最多,机动车拥有量达到了 2.85 亿部,滴滴等网上订车应用每天的数据量是 70TB,刚刚过去的双十一创造了 1800 亿元的销售额。”中国一定是人工智能产业的主战场之一。
主要矛盾
人工智能或整个信息技术的主要矛盾,就是系统日益增长的数据处理压力与计算能力之间的矛盾。现在人工智能领域比较火爆的图像视频应用与无人驾驶等都是计算压力非常大的应用,战胜李世石的 Alpha Go 分布式版本就采用了 1920 个 CPU 与 280 个 GPU,人工智能应用对于计算能力的需求非常惊人。
以人脸识别为例,英特尔数据中心事业部副总裁兼人工智能解决方案部门总经理 Naveen Rao 讲解了为何机器学习或深度学习需要大计算量。与人类和动物不同,机器无法判断图像上哪些部位是特征点,这就需要开发人员用算法将图像的关键点进行提取分类,对机器进行训练,只有大量的数据与计算才能完成训练,“从数据里面提取特征出来需要大量的计算,在过去,深度学习可能要花几个月或者几年的时间来能完成,这是因为当时计算能力很有限。”即便是改进的端到端深度学习算法所需处理的参数仍然有约 6000 万个。
深度学习计算量惊人
“Pikazo 对内存的消耗非常大,最初的版本渲染一张 3.5 兆的图片大概需要一个小时的时间。”Pikazo 应用的宁飞说,“这种动辄数十分钟的渲染时间,肯定非常影响用户体验。”采用 Torch 深度学习框架的 Pikazo 可以将照片渲染成艺术画,但由于便携设备计算能力不足,只能将计算放在云端,大计算量所需数十分钟的处理时间很难让普通用户接受这款应用。
“我们都知道,只有更强大的计算能力才能处理人工智能应用所需的大数据,”Jason Waxman 说,“英特尔预测,到 2020 年,用于人工智能的计算将比现在增长 12 倍。”他还表示,随着信息产业发展得愈加成熟,人工智能应用整体框架的部署变得越来越困难,因为很多原有的基础架构并没有考虑到去适应人工智能应用,“只有 7%的应用部署符合人工智能的要求。”
巨头布局
还不成熟的人工智能已经在多个领域显示出了巨大的潜力。“利用人工智能技术构建的欺诈检测系统,每年避免了数十亿美元的损失,金融机构、政府和我们普通人都是受益者。”Jason Waxman 说,“自动驾驶更是一个万亿美元级别的市场,无论是金融服务、制造业、工业、医疗还是汽车,都将受益于人工智能技术,人工智能的经济效益在未来五到十年将真正体现出来。”
人工智能技术是人类对智力疆域的一次哥伦布之旅,是智力层面的“蒸汽机革命”,正在颠覆或者准备颠覆很多现有的行业与行业领袖。以笔者所从事的媒体行业为例,根据《智媒来临和人机边界:中国新媒体趋势报告(2016)》中的数据,财经机器人写稿量在 2016 年第一季度仅为 400 篇,2016 年第三季度已经达到了 40000 篇。
黑云压城,山雨欲来,如果现在不主动应对,将来只能被动应付,所以行业巨头在人工智能方面的布局出现了加速的趋势,而且犬牙交错,互不相让,谷歌要开发专用于机器学习的张量处理器(Tensor Processing Unit),英特尔也提供了从底层原语、中层框架到上层应用的各种软件解决方案。在应用上,英特尔现在重点布局的是精准医疗、金融服务、自动驾驶与网络安全等应用。
Lake Crest 大概是英特尔版的张量处理器(TPU)
在一年左右的时间里,英特尔先后购入的 Saffron Technology、Nervana Systems 和 Movidius(尚未结案)都是为了完善自己的人工智能布局,Nervana Systems 的创始人 Naveen Rao 成为英特尔新成立的人工智能解决方案部门总经理,由他来掌舵 Nervana 人工智能平台的发展方向。
Naveen Rao 掌控英特尔新成立的人工智能部门
新 Nervana 平台将是一个整合性的人工智能产品组合,既包括现有的 Nervana 硬件平台(至强(Xeon)处理器、至强融芯(Xeon PHI)、至强配合 FPGA 解决方案等)与人工智能软件方案,也包含了规划中的专为深度学习应用而开发的独立加速芯片 Lake Crest 和面向神经网络的 Nervana 图编译器。
Nervana 产品平台
英特尔中国研究院院长宋继强将英特尔的人工智能方案总结为:从前端到后端、从底层到上层完整的堆栈解决方案。
英特尔人工智能解决方案一览
洞见未来
事实上,由于当前绝大部分人工智能应用对计算密度和存储性能等要求极高,所以现在人工智能应用多部署在数据中心上,这正是英特尔的强项。
“目前 90%以上的数据分析都在用英特尔至强处理器平台,其中在人工智能与深度学习的方案或者部署方面,至强处理器的占有率也超过 90%。”宋继强表示,利用 Nervana 技术可以更高效地定义内存访问带宽和计算密度,Nervana 平台能够非常好地匹配人工智能应用不断增长的数据处理能力需求。“Nervana 可以让多个节点并行支持大模型的训练,从而实现一种近乎线性的学习性能扩展。”
并行架构中处理器性能不是系统限制,通信开销决定了系统上限
英特尔还在积极抢占 GPU 的市场,Pikazo 应用最初的版本采用 GPU 处理,最新的版本服务器已经更换为英特尔至强处理器,“Pikazo 的处理速度提高了至少 28 倍,能够渲染的最大图片尺寸提高了 15 倍”从宁飞现场的演示来看,渲染时间确实只需要几分钟。
Pikazo 现场演示
收购 Movidius 以后,在终端方面,英特尔也有了卷积神经网络(CNN)的解决方案。从硬件到软件、从前端到后端、从底层到上层,这样英特尔对人工智能实现了全面覆盖。
利用 Movidius,英特尔将人工智能延伸到终端设备
但在人工智能上英特尔是否可以高枕无忧?未必,如果人工智能真的是颠覆性科技,那么它的成功必然是以一批初创公司崛起,并拿此时辉煌的科技巨头们祭旗为标志。在技术产业化经验上,初创公司远不能与英特尔、谷歌等大公司相比,但大公司的问题往往在于当前的利益遮挡住了未来的路标,内部的纠纷耗尽了有限的资源。
人工智能本来就是一个从现有数据中推测未来的技术,深度介入深度学习的科技巨头所卜筮的结果是什么?能从已有模式中洞见自己的未来吗?