近日,有消息传出,原澳大利亚阿德莱德大学计算机科学学院教授沈春华已于本月正式加入浙江大学。沈春华老师的个人主页也透露出,他已于 12 月份正式加入了浙江大学,目前在浙大紫金港校区的计算机辅助设计与图形学国家重点实验室工作。
11月,复旦大学官宣原蚂蚁集团副总裁、AI团队负责人漆远正式加入复旦大学,出任复旦大学“浩清教授”及复旦人工智能创新与产业研究院院长。漆远只是近期离开互联网大厂的科学家之一。
差不多与漆选同一时间,京东技术委员会主席周伯文也从京东离职创业。8月份,字节跳动AI(人工智能)实验室总监李磊离职,入职美国加州大学圣巴巴拉分校(UCSB)任助理教授。消息一出,引发众多关注。
前段时间清华大学爆出一张《拟聘新进校人员公示名单》的照片,内容中提到 UCLA 教授朱松纯将入职清华大学自动化系,职务为科研系列教授。这一消息让中国科研界又沸腾了。据悉,朱松纯教授是华人 AI 领域的顶级学者。他曾在各种国际顶级期刊上发表论文 300 余篇,三次获得马尔奖,两次担任美国视觉、认知科学、AI 领域跨学科合作项目 MURI 负责人。
几乎每个月都能看到大厂科学家离职的消息。这波AI热潮阶段性结束,神仙们归隐山林,普通炼丹师该考虑转型了。科学家当年高调加入,又在如今低调离场,人来人往也见证了AI领域从绝对的热潮转为低谷。
实际上,无论是“人才回国”引发的爱国主义的热烈讨论,还是 AI 大牛回归高校对人才培养和科研学术的推动,近两年,我们发现 AI 行业一个明显的趋势:越来越多的 AI 大牛陆续离开工业界转而回归学术界。
AI新时代开幕
热火朝天的AI产业并不是一个新鲜事物,AI发展至今,已经经历过三次浪潮:
第一次是50年代,AI从诞生到模拟人,最后失败了被冷落
第二次是60、70年代,专家系统的热潮
第三次是80、90年代神经网络兴起
每一次,都是在理论认知突破后尝试场景化、硬件化,又都由于理论的局限,造成产业的退潮。不过,这一次,AI产业的浪潮与以往不同。半导体产业的飞跃极大推进了AI理论的场景化、硬件化。再往后,AI产业发展的根本瓶颈已经不是芯片技术本身,而在于建立在基础理论之上的,对架构的突破。
基础理论上的瓶颈反映到当下AI面临的挑战中,在找到具体应用场景后,AI公司往往需要面临三大难题:
功耗问题,以自动驾驶为例,当理论上已证明算法可行,但把算法放到真实场景中,在车内测试,现实情况是,一旦开启自动驾驶模式,航程旋即大幅度缩水
本地化问题,如果将算法和数据都放在云端,一旦网络出现问题,车的安全就失去保障,故而在实际场景中,必须有本地化处理的能力
突破时间的限制,所有AI实际场景应用都有时间限制,而现在的云端算法往往还不够快
不管是国内还是国外,近几年优秀的AI人才多数被大企业垄断,这非常不利于AI市场的创新与发展。虽然中国AI公司在应用场景上走在世界的前端,但同样需要意识到的是中国在AI前沿基础研究上明显落后于国外。
技术专家作为走在浪潮最前端的人,最明白技术的发展趋势,他们的态度转变更是说明了 一个不可否认的事实:AI的发展 已经迎来了相当一段时间内难以突破的瓶颈。
只有AI人才在商界的成熟企业、创新型企业、非盈利机构和学界间自由流动,AI的未来市场才会更加健康。在企业呆过的AI科学家在回归教职后,培养出的学生将更适用于企业的发展需求。
大厂留不住科学家
这一趋势最早从吴恩达开始,随后李飞飞、张亚勤、沈向洋等AI界大牛也陆续选择重返高校。
吴恩达的「三步走」可谓是经典,用网友的话说就是:在上升期做科研,在成熟期做产业,在衰落期做教育。
出生于1976年的吴恩达是AI和机器学习领域国际最权威学者之一,也是在线教育平台Coursera的联合创始人:
1997年获卡内基梅隆大学计算机科学学士学位,1998年获麻省理工学院硕士学位,2002年获加州大学伯克利分校博士学位,同年进入斯坦福大学工作,曾任斯坦福AI实验室主任
2010年,时任斯坦福大学教授的吴恩达加入谷歌,创建了「谷歌大脑」项目,通过分布式集群计算机开发超大规模的人工神经网络
2014年5月,加入百度,负责“百度大脑”计划,担任百度公司首席科学家
2017年3月,吴恩达宣布从百度辞职,目前是斯坦福大学计算机科学系和电气工程系的客座教授
2017年3月20日,吴恩达宣布从百度辞职,重新回到自己梦开始的地方coursera,讲述深度学习课程
无独有偶,2018年,谷歌副总裁、首席科学家李飞飞,也重返学术界。担任斯坦福大学以人为本人工智能研究院(HAI) 联合主任。
2019年,腾讯AI Lab主任张潼离职加盟创新工场,出任港科大和创新工场联合实验室主任,并兼任科研合伙人。
张潼拥有美国康奈尔大学数学和计算机双学士学位,以及斯坦福大学计算机硕士和博士学位,在香港科技大学数学系和计算机系任教。 曾经担任美国新泽西州立大学终身教授,IBM研究院研究员和雅虎研究院主任科学家,百度研究院副院长和大数据实验室负责人,腾讯AlLab主任。 是美国统计学会和国际数理统计学会fellow,并担任NIPS、ICML、COLT等国际顶级机器学习会议主席或领域主席,以及PAMI、JMLR和Machine Learning Journal等国际一流人工智能期刊编委。
2020年7月,旷视南京研究院创始院长魏秀参离职,出任南京理工大学教授。
魏秀参师从南京大学周志华教授和吴建鑫教授从事人工智能领域研究,主要研究领域为计算机视觉和机器学习。 在相关领域国际顶级期刊及国际顶级会议发表论文四十余篇,相关工作获得iWildCam 2020、iNaturalist 2019、Apparent Personality Analysis 2016等计算机视觉领域国际权威赛事共4项世界冠军。 担任ACCV 2022讲习班主席、ICCV、IJCAI、ACM Multimedia、ACCV等相关研讨会程序委员会主席,AAAI 2022、IJCAI 2021、BMVC 2021高级程序委员或领域主席。
2020年7月,字节跳动副总裁、AI Lab主任马维英离职,加入清华大学智能产业研究院。
马维英在美国加州大学圣芭芭拉分校(UCSB)电气和计算机工程系获得了硕士和博士学位,曾在世界级会议和学报上发表过逾 300 篇论文,并拥有 160 多项技术专利。电气电子工程师学会会士(IEEE Fellow),曾任国际信息检索大会(SIGIR 2011)联合主席、国际互联网大会(WWW 2008)的程序委员会联合主席。
2021年8月,字节跳动AI Lab总监李磊离职,加入大学圣巴巴拉分校(UCSB)。
李磊曾就读于上海交通大学计算机系本科ACM班,获得卡耐基梅隆大学计算机系博士,并担任加州大学伯克利分校博士后研究员。 在机器学习、数据挖掘和自然语言理解领域于国际顶级学术会议发表论文40余篇,担任2017 KDD Cup与KDD2018 Hands-on Tutorial联合主席和ICML、KDD、IJCAI、AAAI等大会程序委员。
科学家也要背KPI
在阿里的7年时间里,漆远曾任阿里数据科学技术院执行院长、蚂蚁集团首席AI科学家及数据智能委员会主席,也完整经历了一个大厂研究院的成长和动荡。
2014年,当时已经是美国普渡大学计算机系和统计学系终身教授的漆远,在阿里技术委员会主席王坚的邀约下,登上了回国的飞机。为了拉来漆远,王坚给出的“诱惑”是阿里用之不尽的商业数据,大量数据的价值蕴藏其中,并让漆远建立超大规模机器学习平台。
与漆远同一时期回来的,还有美国密歇根州立大学终身教授金榕,阿里数据技术研究院iDST就此创立,当年这个号称阿里最神秘的部门,目标是确保阿里在未来数十年做到技术领先的地位。
风风火火的iDST就像是一场浅尝辄止的尝试,iDST成立不久,就发现技术突破、落地的时间被低估,而这些从高校迈入商业公司的科学家,身在局中也不得不跟着转身。
2015年夏天,成立不到一年的iDST被迅速拆分,这些被王坚邀请回来的科学家走出实验室不到一年,就被送往各个事业线,其中金榕去了淘系;漆远则去了蚂蚁金服。
“说白了,技术和商业能不能相互理解,这可能是当时最大的矛盾。”后来漆远在回顾这场实验时表示。
据此前媒体报道,当时阿里对于iDST的角色定位,是要做阿里其他部门不愿做也做不了的事情。而这个创新部门,也没有背负绩效考核目标。
但事情渐渐发生了一些变化。技术和商业的矛盾不容易解决,但打造技术研究院的意愿仍在,于是在2016年,达摩院计划被提了出来,许多iDST的旧部后来也选择加入达摩院。相比前身iDST没有绩效考核,达摩院计划在提出时就强调,其使命是技术创新,但需要结合阿里的具体业务。
AI落地困难自然是造成这一困境的重要原因。
落地,是 AI 学术研究的最终归宿 ; 没有落地,梦再美,都是枉然。然而,学术界和工业界在 AI 思维上一直存在分歧。
学术方向的研究,希望探索的最前沿的问题,并且不计成本,不计营收
工业和企业角度而言,更偏实用,成本和产出必须被严格审视。随着技术门槛进一步降低,企业内部的技术话语权,必然会回到工程派、产品负责人手中
科学家和业务之间的矛盾,体现的最明显的并不是在管理者身上,而是那些夹在科研和业务之间的研究员,不仅要有成果,也不能只专注于手头的科研工作。对于他们来说,就是在接连的架构调整之中,一阵要配合业务,一阵又要注重研究产出。
一位先后待过大厂研究部门和业务部门的技术人士表示,在与腾讯的研究院和阿里达摩院合作的过程中可以感受到,共同点是科学家们光产出Paper是不够的,他们都有业务产出的压力,为此,甚至有人会挨个和业务部门的人接触,目的是“分到一些业务”。
而字节跳动AI Lab实验室在架构上直接属于字节跳动的Data部门。马维英作为实验室主任离开后,AI Lab下的各个组直接对接Data部门,这意味着,AI Lab在字节跳动技术体系内的地位进一步下降。
业务部门可能以前是对研究院抱有很大期待的,但经过这么多年发展,发现很多很顶尖的Paper,在业务里其实是没法用的。这就是做研究和业务的巨大鸿沟,一个例子是,做研究的时候,用到的数据可能是很完美的,但实际上业务里的数据很复杂很“脏”,反而可能是一些简单的策略会更有效。
作为业务部门其实也不太乐意和研究部门合作,就算是包给他们做,洗数据、调模型这些事情还是要业务来配合,再加上一些沟通的成本,还不如业务部门自己解决。合作之后,双方可能还要掰扯一些KPI计算分配这样的细节问题。
因而,很多时候业务部门把一些边角的工作给到了研究部门,核心的业务扔紧握在自己手上,最终研究部门的成绩也不会出彩。这导致研究部门非常尴尬。
在大公司做科研,向上管理非常重要,但不是每个高校出身的研究员都能掌握这项职场技能。有的出身藤校博士的研究员,在里面折腾了几年至今还只是P7,现在想搞点自己感兴趣的项目都很难。
一位近两年从美国博士毕业回国任教的青年学者表示:相较于工业界,回学术界任教对于研究人员有着更高自由度的吸引力:从企业的研究科学家转型为高校的教授,他们往往可以在自己感兴趣,但是并不为公司短期所需要的的基础研究方向上投注更大的精力而不求短期的回报。
洗牌时刻:2.0时代
不管是国内还是国外,AI研究院的作用都可以大致分为三类:
基础研究作为技术储备,可能未来有很大用处
为实际业务提供支持,强调和实际场景结合实现技术落地、商业化
秀肌肉,考验企业的公关能力以达到宣传、吸引人才的效果
几年过去了,AI 行业并没有往大家设想的蓝图方向发展,反而是行业遭遇大洗牌,明星公司相继陨落。行业触及天花板,AI 大牛选择回归学术界。不可否认,相比于前几年的发展,现如今的 AI 产业呈现出一种“繁荣”现象,但是似乎也碰到了一个天花板,产业创新进入了一个瓶颈期。
对互联网公司来说,从人才下海热到回归热,经历了从狂热到“冷静”。互联网企业增长趋于停滞的时候,高投入却短期看不到回报的AI研究被率先冷落:
一方面,最近几年国内科技公司AI Lab正在面临越来越多的业务压力
另一方面,在目前科技公司高待遇的背景之下,高级研究人员可以在几年之内获得很高的财务回报,这也让他们在选择之后的职业生涯时有了更大的自由度
- 阿里达摩院已经被要求盈亏自负
- 腾讯的AI Lab和优图实验室也更多的成为内部的算法提供者而不是通用研究平台
- 字节的AI Lab在大约半年前经历了一次组织调整,部分人员已经更加专注于业务方向
- 百度研究院在领军人物吴恩达(Andrew Ng)离开之后经历了一波较大的基础研究人员流失,较巅峰时期,规模大大缩减
就算是在硅谷,能坚持大量资源投入、为科学家研究提供高自由度的公司可能也只有谷歌、微软和Meta。这也显示出,基础研究需要长期高额的投入,但遥远且模糊的回报让这场游戏变得不是每家公司都玩得起。
在谷歌的版图里,DeepMind是大公司研究院的标杆,即便如此,商业化的压力依然存在。DeepMind联合创始人Humayun Sheikh自己也说过:如果谷歌没有以6 亿美元的价格收购DeepMind,他们的AI实验室可能已经破产。DeepMind自从2010年正式成立以来,就从没实现过盈利。
过往报道显示,DeepMind的主要营收来自Google和YouTube等内部项目。就是这样一个倾斜了无数资源的研究院,只是在内部落地,就已经困难重重。
今年5月,《华尔街日报》爆料,DeepMind已经和谷歌争吵了数年,前者希望在运营上获得更多自主权,以及一个独立的法律架构。但谷歌最终收紧了对AI研究的控制,在今年彻底拒绝了这一请求。
据The Information消息,有谷歌员工不满于Deepmind的特殊地位,他表示Google Brain已经证明了自身的价值,他们所做的事情是基于谷歌已有的业务,开发例如优化地图的图像识别功能、优化语音识别能力之类的工作。但转头一看,DeepMind研究的东西看起来很厉害,但折腾了几年什么钱也赚不到,可能未来十年时间都做不到收支平衡。
最舍得在基础研究上砸钱的谷歌尚且如此,就更别说靠着融资运营的AI初创。在国内,能够看到较完整财务数据的就只有被称为AI四小龙的商汤、旷视、云从和依图,他们已经是此次AI创业热潮中的明星公司。
亏损,是CV四小龙避无可避的话题。AI企业特有的高科技、高人才、高研发的“三高”富贵病魔咒,赚的钱赶不上研发投入的钱。在“悲催”背后,是这几家公司均未实现盈利、依然需要大量资金投入、商业化场景落地困难的现实。
早年间,CV四小龙几乎都在探索AI+行业,而“行业”则包含金融、零售、安防、汽车、物流等领域,不同点在于各自的领域各有侧重。但从2019年前后,同处计算机视觉下的AI四小龙开始讲起了“独特”故事:
旷视把目标定在了AIoT上,所有业务都要带上“物联网”。基于此,还打造了“算法+软件+硬件”的一体化产品体系,推出物联网时代的AIoT操作系统。目前,在招股书中,其主要业务分为物联网解决方案、城市物联网解决方案、供应链物联网解决方案
依图则在探索应用场景过程中发现了产业链上的“芯片”一环,于是打开了“算力提供商”的新世界,以人工智能芯片技术和算法技术为核心
商汤招股书中,其主营业务分类为智慧商业、智慧城市、智慧生活和智慧汽车。将自身定位成人工智能软件平台型公司,打出了“1(基础研究)+1(产业结合)+X(行业伙伴)”战略,AI+“所有”,没有给自己限定场景,什么行业都做
云从则是涉及智慧金融、智慧治理、智慧出行、智慧商业四个领域
作为CV领域的“小弟”,格灵深瞳的业务分类为城市管理产品及解决方案、智慧金融产品及解决方案、商业零售产品及解决方案
尽管说法各有千秋,但实际上他们几家最初的技术门槛与路线接近,商业化场景也都是从消费、安防、金融等领域开始,所以,这几年来不断喊出的新口号,追根溯源,还是新瓶装旧酒。AI企业家们现在讲出的故事,早已不再能如同此前般打动人心。
四家公司在一级市场融资接近500亿元,总估值超过了1400亿元。随着技术逐渐成熟,商业化的脚步却迟迟没有达到理想的进展。二级市场的表现倒挂一级市场,这让投资者们对“估值高、回报周期久”的AI公司已经失去了信心和耐心。资本冷却的重担最先就砸在了“CV四小龙”所在领域。这堪称“三十年河东三十年河西”,此前CV是中国市场AI行业中技术和落地均发展最快的,现在,它却成为“卷”得最厉害的窄巷。