本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处
倚天一出,谁与争锋?
5nm、单芯600亿晶体管、128核、主频3.2GHz……首战跑分就超出业内标杆20%,能效比提升50%以上。
这就是阿里平头哥半导体,在2021云栖大会现场交出的最新造芯成果。
取名倚天710,一颗自研云端芯片,刷新了Arm服务器芯片性能纪录。更重要的是,这也是阿里平头哥成立以来,第一颗通用芯片。
以“生死看淡,不服就干”进军造芯3年来,平头哥先后推出了处理器IP玄铁910、AI推理专用芯片含光800,并且落到地商用。
但CPU,作为计算机系统最核心单元,无论难度还是重要性,意义如何强调都不为过。
在专用芯片含光800发布时,阿里巴巴集团CTO、达摩院院长张建锋谦虚表示:这是平头哥的万里长征第一步。
而现在,随着倚天710发布,通用芯片的成功拿下,毫无疑问标志着平头哥半导体来到了一个更大的里程碑节点——长征路上的艰难一役已被攻克。
同时,对于开启商业互联网向硬科技转型的阿里巴巴而言,亦是标志性时刻。
倚天710,一颗怎样的芯片?
一颗通用服务器芯片(CPU),负责接收、处理、运算服务器计算机内部所有信息,是业内公认的设计难度最高的芯片之一。
但平头哥出手,选定的就是最具挑战的赛道。
倚天710采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的Arm v9架构,内含128核CPU,主频最高达到3.2GHz。
内存和接口方面,同样集成业界最领先的DDR5、PCIE5.0等技术,可以有效提升芯片的传输速率、适配云的不同应用场景。
在行业基础测试平台SPECInt2017上,跑分高达440,超出此前业界标杆20%,首战即巅峰。
而且性能巨兽还兼顾了功耗。
能效比相较业内标杆,实现了50%的优化,在数据中心应用中,节能减排意义不言自明。
没错,数据中心、云服务,将是倚天710的最核心商用场景。
作为一颗高性能服务器芯片,倚天710针对云场景的高并发、高性能和高能效需求而设计,把最前沿的芯片设计技术与云场景的独特需求相结合,最终实现了性能和能效比的突破。
比如云计算高并发条件下的带宽瓶颈,倚天710就对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。
这也是为什么倚天710一出,Arm赛道服务器CPU无人能与争锋关键原因。
Arm基础设施事业部全球副总裁邹挺就表示:
阿里巴巴作为公有云的头部厂商之一,为其他云服务提供商树立了可以效仿的标杆。
对Arm来说,平头哥在服务器处理器倚天710芯片的研发成果无疑是一项重大的里程碑,同时也验证了Arm IP在基础设施领域的产品路线图以及每瓦性能的优势。
我们为平头哥的技术团队感到高兴,期待继续与平头哥和阿里巴巴在芯片设计、软件应用优化以及生态孵化方面开展进一步深入的合作。
但即便成果如斯,阿里云智能总裁、达摩院院长张建锋,对倚天710强调更多的,还是客户第一。
他说,倚天710的发布,是基于阿里云“一云多芯”和“做深基础”的商业策略的结果,初心只是希望满足客户多样性的计算需求。
所以也是在这种策略之下,倚天710不选择对外出售,主要是阿里云自用,与自研AI推理芯片含光800一样,以云服务方式实现价值输出。
张建锋还表示,将继续与英特尔、英伟达、AMD、Arm等合作伙伴保持密切合作,为客户提供更多选择。
首款CPU如何炼成?
平头哥不是上来就“敢”挑战通用芯片的。
在倚天710之前,平头哥先后交货RISC-V处理器玄铁910、首款专用芯片含光800,对于芯片设计和流片领域,已然不再是“新人”。
但即便如此,这也不代表可以轻而易举跨越——专用芯片到通用芯片的技术鸿沟。
如果将专用芯片类比为人类负责某一项能力的神经元,那么通用芯片,就好比大脑。
复杂性可见一斑。
所以哪怕半导体行业历史已然不短,但全球范围内,掌握CPU打造能力的半导体公司,也屈指可数。
可以明确的是,CPU是半导体行业设计门槛最高的芯片之一。
具体到数据中心领域,其CPU同样是业内公认最复杂的芯片之一,其架构设计复杂,对性能、功耗要求极高……
平头哥交货之前,全球只有Intel、AMD、AWS、华为等公司掌握这样的技术实力。
如果再算上制程、封装,以及性能和功耗,能者更加寥寥。
而平头哥不仅干了,还一干就瞄准顶级性能,挤爆牙膏,把服务器芯片带进5nm时代。
关于芯片的工艺,用其另一个名字“集成电路”,可以更好理解。
芯片,就是由大量晶体管组成的复杂电路,其中晶体管的栅极是最窄的线条,这个线条的宽度就代表了工艺的大小。
工艺越小,单位面积所能容纳的晶体管就越多,而芯片的性能也会越强,但这一数值越低,对技术的要求也越高。
在此之前,服务器芯片最先进的工艺仍为7nm,如果倚天710设计之初就定位7nm,可能会更稳妥。
但如果要挑战5nm,就得在能量密度、芯片内部结构布局等方面,有更多开创性的工作。
据说在研发过程中,平头哥团队光EDA软件调度就多达30多种,还度定制时钟网络和定制IP技术,此外采用了先进的多芯片堆叠技术,就为确保了芯片性能、功耗的优化。
为什么非要5nm?
回答是:没得选。
平头哥方面解释,终端设备的寸土寸金,让外界更容易理解制程工艺之于CPU的重要性。
但易于忽略的是,用于服务器的高性能CPU,同样对制程工艺要求极高。
随着算力需求突飞猛进,对服务器CPU的性能要求也在水涨船高。
如果平头哥选择7nm,甚至退回10nm,不仅会导致面积上的增加,而且难于放下更多的Core……
另一方面,制程越先进,芯片越小,运营成本节省也会越多。
在数据中心领域,评价芯片有专门的重要维度叫TCO,即总拥有成本,所以数据中心芯片对于功耗异常敏感,更先进的制程,会在7×24小时运转运营中,节省更多的电力成本。
所以在研发过程中,“潜在客户”阿里云,就明确在性能、制程工艺和功耗方面,提出了更高的要求:
如果不能比现有方案更好,那就没有升级的必要。
如果不能比现有方案更强,也缺乏升级的说服力。
从这个维度来说,不难理解平头哥团队透露的“唯有最顶级才能生存”。
这不仅是自身产品能力的证明,更是平头哥商业化、可持续经营的题中之义。
与绝大多数芯片公司不同,平头哥的模式并非直接芯片对外售卖,而是服务云端,以阿里云对外输出,其最大客户就是阿里云。
但也是这种原因,让倚天710的首战即巅峰,多少有点制度优势的意味。
因为背靠阿里云这个全球前三的云平台,平头哥的云端芯片,从定义和设计之初,就比独立供应商更能深刻理解数据中心的业务场景和需求。
可以说是真正面向需求的芯片设计模式,最终追求的也是芯片即服务。
这也能解释,不论是AI推理芯片含光800,还是服务器CPU倚天710,为何都能有如此瞩目的性能提升。
不过值得注意的是,阿里平头哥的芯片推进,不光是这种性能上的纵深突破。
在本次云栖大会现场,另一则生态建设方向的软进展,同样可能影响深远——
平头哥方面正式宣布:开源玄铁RISC-V系列处理器,并开放相关工具及系统软件。
这也是发布玄铁910等处理器IP后,平头哥在RISC-V生态上的重要举措,成为了系列处理器与基础软件的全球首次全栈开源案例。
在玄铁910推出时,我们就介绍过“一个时代有一个时代的芯片”。
RISC-V架构因其开放、灵活的特性,有望成为继Intel x86、Arm后的下一代广泛应用的CPU架构。
但当前RISC-V架构面临的挑战也非常直接:应用碎片化、开发效率低、软硬件适配难等等。
归结起来就是,软硬件生态尚需更上一层楼。
而玄铁开源,可谓稳准狠出击,切中RISC-V生态发展刚需。
在AIoT领域中,平头哥自研推出的玄铁RISC-V系列处理器,覆盖从低功耗到高性能的各类场景,支持AliOS、FreeRTOS、RT-Thread、Linux、Android等操作系统,并已成功应用于微控制器、工业控制、智能家电、智能电网、图像处理、人工智能、多媒体和汽车电子等领域。
目前出货更是已超25亿颗,拥有超150家客户、超500个授权数,成为国内应用规模最大的国产CPU。
所以此时开源,生态拓展的目的,再明确不过。
而且对于观察平头哥,这同样是一则意义明确的风向标注脚:
这家2018年成立的半导体公司,雄心和价值,不会止于哪款芯片本身。
倚天710之后,再看平头哥?
时间重回3年前,依然是云栖大会。
那年阿里巴巴官宣造芯投入最大升级,成立平头哥半导体公司。
外界都关注热议“生死看淡,不服就干”的平头哥精神,但对于阿里这次高调造芯的未来之路,并非没有质疑。
它是一个布局已久的决定。
从2016年阿里投资软件定义网络(SDN)芯片公司Barefoot,其后延展覆盖AI芯片、物联网芯片等领域,将翱捷科技、寒武纪、深鉴、耐能(Kneron)、中天微、恒玄科技等纳入旗下。
同时达摩院中,组建起一支由半导体行业的工业界和学术界顶级专家组成的技术团队,研究方向全面涵盖系统架构、计算技术、存储技术以及芯片工程等核心芯片设计技术,然后成立平头哥后,率先在AI专用芯片领域取得成果。
但平头哥的推进,依然被认为是一次过于大胆的跨界尝试。
即便全球范围内,也还没有哪家公司,能够短短数年内,完成专用芯片到通用芯片的跨越。
所以倚天710交货,不仅是平头哥已具备复杂大芯片设计能力的证明,也是阿里造芯标志性一役。
如果说AI专用芯片含光800的发布,被视为万里长征第一步。
那通用芯片倚天710,则表明阿里造芯的长征行军,完成关键一役。
现在平头哥交出的成果和芯片能力证明,足以跻身顶级半导体公司序列。
其次,这同样也是22岁阿里巴巴的历史性时刻。
在阿里内部,2009年成立阿里云、启动飞天操作系统,被看作探索前沿科技的开端。
然而过去10年来,阿里的成功,更多被认为是商业上的成功、运营上的成功,而不是科技实力上的成功。
直到2017年达摩院推出,包含AI、量子计算、自动驾驶、芯片和5G等前沿技术领域探索被明确,才让人感知到商业巨头面向硬科技转身的强烈决心。
而平头哥半导体,就是这种转型努力的集大成者。
在最硬核、最底层的芯片半导体领域,从发布RISC-V玄铁处理器,到发布AI芯片含光800、通用服务器芯片倚天710,平头哥三年完成“三级跳”。
这种跨越并不容易,但正是这种难,方能证明前进方向的必要性和正确性。
幸运的是,阿里再次用成果说话,把相信变成了看见。
所以倚天710交货,同样也是阿里硬科技再上新台阶,从商业公司向硬科技公司转身的标志性时刻。
当然,这甚至不止于阿里一家公司本身。
过去几年风风雨雨里,中国在芯片领域面临的客观现实,震惊了所有人,教育了所有人。
中国最大的出口商品是什么?品类有争论。
但中国最大的进口商品是什么?答案有且只有一个:芯片半导体。
尽管在芯片设计领域,不同的力量正在快马加鞭补足短板。
但高性能CPU市场,建树有限,始终处于落后待供应状态。
而现在,5nm倚天710一出,局面得到根本性扭转,在高性能服务器芯片领域,新的标杆和灯塔,日出东方。
这或许也是阿里平头哥团队,将这款芯片以倚天来命名的原因。
有意思的是,自交货以来,平头哥团队就选取中国上古和武侠中的“神兵利剑”成为每一款产品的江湖代称。
玄铁是“重剑无锋,大巧不工”的处理器IP。
含光是“视不可见,无往不利”的AI专用芯片。
而倚天……首款CPU芯片。
倚天一出,谁与争锋?!
李根 鱼羊 博雯 发自 云栖小镇
量子位 报道 | 公众号 QbitAI