沐曦集成电路(上海)有限公司CTO杨建
12月22日,在无锡举办的“中国集成电路设计业2021年会暨无锡集成电路产业创新发展高峰论坛(ICCAD 2021)”上,沐曦集成电路(上海)有限公司CTO杨建带来主题为《通用算力的需求和机遇》的精彩分享,以下为演讲全文:
我们看一下四次工业革命的发展,第一次工业发展是燃气之后推动机器化发展,以前是用水带动磨坊磨麦子,后来带动蒸汽机。第二次工业革命是电气化,最大发明人是爱迪生。第三次工业革命到现在是信息化、自动化时代,过去几年,中国自动化发展的很快。最新的工业革命时代是智能化,起源于2014年开始的预算,要感谢他,另一个要感谢的是GPU算力。
在整个发展过程中,我们邓公很厉害,给我们提出科学技术是第一生产力。目前中国一年有20万大学生毕业,回到十年前,只有10万,所以科学技术是第一生产力一定是没错的方向。
很早就有计算,比如中国祖冲之的计算圆周率。在二战的时候、一战的时候,弧线到落地点要计算,问题并不复杂,但是在那个时代,只有手摇计算机,没有电子计算机20年前,计算不发达,我们计算都是一张一张的表去找的。第一台电子计算机,每7分钟就要换一个晶体管,计算过程每7分钟就要停一下,这是非常可怕的事情,每次的计算能力只有5000次,但是比手摇计算机已经快了3000倍到5000倍,非常快了,差不多可以达到每次做5000次加法的计算。回到计算的历史,计算历史是以西方开始在研究行星的运动规律,特别是开普勒发现行星是椭圆形。根据某一个点的不规则,计算另一个行星大概是在什么位置。到了牛顿时代,他用归纳法,上海这边说中学生一定要在学物理和化学的时候学会归纳法,这是非常基础的科研方法,牛顿最大的贡献是天体物理、力的作用用公式化表明,整个世界进入新的时代,是整个现代科学发展的鼻祖。到了20世纪,传统做实验方法已经被计算方法替代了,计算的时候可以计算更新的物质,比如某种化学反应,更小的发动机。现在到了2014年之后,进入大数据时代,包括智能化时代。
这是经典的科学计算维度图,算一个物体,从10的-3/1尺度,到大尺度,最大尺度是航天动力的雷诺系数,把所有空气动力学问题解到的话,按照现在的半导体水平,需要到2080年。2080年,雷诺多希望达到100米,大型航天器都可以利用这个技术求基,而不需要风动。
过去疫情期间,我们更多的尺度是在纳米级上找新冠药物分子结构,过去两年发展非常快,对于中国大的制造产业发展,比如汽车和飞机,这是制造业最顶端的两个东西,中国在未来需要大量的计算做汽车外观、重量材料。
下面要讲的,其实是一个稳流问题,当一个流体,这个水看起来不动,是静态的,其实不是的,它一直在流动,它是可以计算出来的。右边的是常见的飞机起落架设计,我们知道,飞机在降落的时候,它最大的噪音来自于起落架,起飞的时候它展开了,产生了很大的动力,这些东西都需要计算表达。
过去中国造了世界最大的风动,现在中国在造世界最大的数字风动。制造的时候通用算力用网格表达,网格越密,计算精度越高,现在空气动力学可以达到2%的精度,我们可以算出来飞机在平流层飞行的时候,某个速度下需要的声力多高,需要耗多少油。更高精度,需要把网格更加密,原理飞机场的位置可以把精度降低一点,不需要那么精确。所有的计算有两种算法,一种是有限元法,一种是有限容积法。最终会展开一个线性方程,线性方程计算量非常大,目前是10亿×10亿的线性方程,2080年可能需要再增加1000倍的网格,才能达到100米的系数。
通用算力是数字时代的发动机,关于燃料问题,燃料在3000年前的《圣经》里就记载,说中东有个东西,点燃就可以燃烧。在智能化时代,人工智能这个问题提出的很早,在50年代就提出了,但是一直没有形成真正的社会推动力,为什么?因为算力缺失,导致没有算力时代的发动机。
2014年,2015年人工智能开始爆发,2014年,一个有钱公司货研究室有100张显卡,他能够在2014年和2015年做一个算法。现在不行了,现在做大型算法,你可能需要5000张显卡,做6个月才能做出来,这是对算力需求比较巨大的增长。2015年之前,两次人工智能寒冬,我认识很多博士生,在八十年代初到九十年代中,他们花八年、十年都没有拿到博士学位,现在全民几乎都在做人工智能、做计算,三四年就能拿到学位。
新时代,我们说计算里就是生产力,自动驾驶到L4的时候,大概需要2T算力才能到L4驾驶,L5自动驾驶需要3-5P的算力。智慧城市,金殿比较发达的一线城市,按照今天需要的摄象头数量,还需要增加10倍到20倍,同时目前整个智慧城市已经处理的摄象头数据目前连1%都不到,算力非常大。看一下整个计算的扩展,过去在做化合物合成,特别是无机物合成、晶体合成,必须做实验,我读书的时候,IDM有一个博士为了做一个材料,做4万次,失败了,他把失败写成一篇论坛。在去年的12月份,第一次人内在计算机上观察到了多晶硅的结晶过程,他把整个硅圆子的结晶过程做成纳秒之后,在计算机上实现计算,它就来源于算力。我们对于计算算力的需求,在过去6年期间,特别人工智能和科学计算,是按照每3.5个月算力增长一倍的需求在往上增长。
国家对“十四五”的规划。芯片是我们的钢筋混凝土,设计师是各种应用,你要把房子装饰城大楼,还是别墅,还是工作室,这是我们做的事情,整个社会要进行数字城市、数字孪生,在大全球不太稳定的情况下,数字孪生对全球非常重要的是恐怖分子的袭击、毒气、炸弹爆炸这些方面的作用。数字经济里有一个观点,数据发展非常快,大概每年增长一倍到两倍的数字,而且会越来越快,数字和GDP有越来越正向的关系,中部现在是迈进中等发达国家的节点,我们去看世界前三名数字算力高的国家,就是日本、韩国、美国,他们会高很多,卖资源的国家不算,卖资源的国家是靠卖老祖宗的地吃饭的。数字经济的基点是4000亿,上面还有各种各样的软件和应用。
体现一个国家算力水平最高的大装置是超级计算机,中国发展和全世界相比,还处于第一梯队,不算第二梯队,这里面,日本、中国和美国是最重要的发起竞争者,欧洲自己没有芯片,欧洲全要依赖美国那边给的装置往下走。日本不太一样,美国制裁日本之后,80年代后,日本所有的超算芯片都自己做,没有买过任何国外芯片。中国的太湖之光还是蛮厉害的,就在无锡,算力曾经一直排名在世界排名第一梯队,蝉联四五年时间。美国是CPU+GPU的结构。
中国超级计算机的数量真的很多,但是我们资源太浪费,我们数量是美国的2.5倍,但是总算力仍然没有美国高,我们有很多小的重复建设,没有从政府战略层面做规划,这是我们观察到的结果。
再看全世界去年超级计算机的排名,前五名是日本、中国、美国,日本是富岳,美国是上一代的超算,美国所有的超算都进入CPU+GPU阶段,意味着他的95%以上算力是GPU提供,CPU只作为辅助控制系统。日本的富岳一期工程,因为没有达到日本政府的要求,所以说二期工程已经停掉了,本来今年应该上二期的,预计今年实现亿级计算。
GPU是图形处理器最重要的掌上明珠,为什么这么重要?现在除了CPU之外,提供算力最大的是GPU,全世界将近有5000万程序员可以在上面写程序。GPU是两大公司在控制,我们沐曦希望成为世界第三极,形成三国鼎立,在世界舞台上拼搏。
我们去年9月份成立,现在是15个月,还没有产品,未来可以看到我们的产品,我们现在在全国有6个Office,超过450人,将近500人,70%是硕士,80%是研究人员、开发人员,10%是博士,发展本质迅猛。我们公司MataX,我们公司的文化,其中有一条讲到Teamwork,我们要和上游的供应链做Teamwork,中芯国际未来可能会提供下游生产的Teamwork,我们希望后面可以和更多伙伴完成生态的发展。
我们的市场主要面向高性能计算、以GPU做核心,展现算力本身的发展。公司有4大竞争力,所有IP,核心GPU IP自研,现在做自研IP的有200多人,软件会去兼容生态,利用前人的生态,站在前人生态的基础上,扩大对客户的支持。另外我们的创新很多,从去年9月份成立到现在,申请了70个专利,这是非常训练的过程。