3月14日,由达摩院举办的2024玄铁RISC-V生态大会在深圳举行,这也是第二届玄铁RISC-V生态大会,汇聚了来自全球数百家企业及机构,展示了玄铁RISC-V在PC、服务器、电力、5G通信、机器人、金融等不同行业涌现的应用创新。
5年9款CPU累计量产超40亿颗!
众所周知,在CPU指令集架构市场,x86架构统治着90%以上的PC及服务器市场,Arm架构则完全垄断了移动市场。而新兴的RISC-V架构虽然早在2011年就被美国加州大学伯克利分校的的EECS部门的计算机科学部门的David Patterson教授及其团队成功研发并开源,但在2015年RISC-V国际基金会成立之后才开始正式推广。得益于其开源、开放、简洁、灵活等特性,经过近十年的发展,RISC-V已成为x86架构和Arm架构的强有力的挑战者,并有望形成了三足鼎立之势。
“开源模式获得巨大成功,已经从软件领域走向硬件领域。RISC-V作为开源的指令集架构,相比X86、Arm有着很大的优势。未来RISC-V很可能发展成为世界主流的CPU之一,从而在CPU领域形成x86、Arm、RISC-V分天下之势。”倪光南院士在玄铁RISC-V生态大会上指出:“特别是随着创新的处理器架构——DSA(特定领域架构)的兴起,RISC-V凭借其自定义扩展指令的特性,成为了实现DSA的有效途径。融合RISC-V、扩展指令集、DSA、Chiplet及其互联等技术,发展RV-DSA服务器是中国的一个机遇。”
根据达摩院援引SHD集团的数据显示,RISC-V基金会在2015年之时仅有17家会员,到2023年底之时就已经达到了4037家。同时,SHD集团预测,自2022年至2030年,RISC-V在主流市场年复合增长率将高达40%。基于RISC-V指令集架构的芯片的年出货量将由6亿颗增长至160亿颗。在MCU、笔记本电脑、5G、工业、消费类AI、汽车AI等主流应用中的占比将达到约30%。
阿里达摩院院长张建锋也感叹道:“RISC-V从开始推广商用到实现累计出货100亿颗芯片,仅用了约十年的时间,就完成了Arm架构30年的历程。作为一种新兴开源芯片架构,RISC-V以其开放、模块化和可扩展的核心特性,极大地降低了开发者参与创新的技术门槛,为整个半导体产业带来了前所未有的机遇。”
作为中国RISC-V领域的领军企业,阿里巴巴达摩院自2018年起就开始投入研发RISC-V架构,是国内最早涉足RISC-V的技术团队之一。自2019年3月,阿里巴巴达摩院就正式发布了当时业界最强的高性能RISC-V处理器内核——玄铁C910以来,时至今日,仅5年的时间,就推出了3个系列9款产品。
具体来说,这3个系列9款产品包括:面向低功耗、高能效应用(MCU/无线)的E系列(E902、E906、E907);面向高性能应用处理及Al增强应用(语音/视觉/边缘)的C系列(C910、C906、C907、C908、C920);面向高可靠实时应用(工排/车载)的R系列(R910)。实现了对于高性能、高能效、低功耗、高实时性等不同场景的覆盖,被广泛应用于边缘计算、无线通讯、工业控制、通用MCU等30多个领域及应用场景。
根据阿里达摩院院长张建锋公布的数据显示,截至目前,玄铁3个系列9款产品累计授权客户已经超过300家,授权个数超过800个,累计量产颗数突破40亿颗。
这个数据是个什么概念呢?根据RISC-V基金会的数据,截至2022年底,基于RISC-V内核的芯片出货量累计已经达到了100亿颗,其中约一半是来自中国。也就是说,自RISC-V于2015年商业化以来至2022年底,7年的时间所有由中国厂商设计的RISC-V芯片累计出货约50亿颗。而达摩院仅用了5年的时间,就出货了超过40亿颗。
可以说,玄铁处理器已成为目前国内RISC-V领域影响力最大、出货量最大、最受欢迎的处理器产品系列。同时,在这5年的布局之下,玄铁RISC-V生态也已经成为目前国内覆盖面最广、参与厂商最多、发展最为成熟的RISC-V生态之一。
突破性能瓶颈与AI融合,迈向更广阔的市场
目前在PC及服务器CPU市场,x86架构占据着近90%的市场份额,这主要因为多年来x86处理器与Windows系统之间的生态的捆绑;在移动CPU市场,则几乎完全由Arm架构统治,也得益于过去十多年来Arm处理器与Android系统之间的生态捆绑。而RISC-V架构所具备的指令精简、模块化、可扩展、开源等特性,所带来的低功耗、低成本、高能效、高可扩展性等优势,也与很多物联网应用天然契合,这也正是RISC-V迅速在物联网市场获得成功的关键。
物联网市场虽然整体市场体量不小,但是却非常的碎片化,很多细分市场不仅培育周期长,出货量也很有限,价值量也较低。所以对于RISC-V阵营的厂商来说,要想获得更好的发展,就必须进入到市场更广阔的PC/服务器、移动终端、汽车等高价值市场,与X86、Arm进行正面竞争,而这首先就必须要突破性能上的瓶颈,并完善软件生态。
对于达摩院来说,其自2018年起开始投入研发RISC-V架构之时,就率先瞄向了高性能领域,其在2019年3月推出的首款RISC-V处理器内核——玄铁C910正是当时业界最强的高性能RISC-V处理器内核。
而随着边缘AI热潮的兴起,很多应用对于AI性能的要求也越来越高,因此,对于RISC-V来说,在提升处理器性能的同时,也需要把AI的性能做好。
原达摩院高管、知合计算CEO孟建熠表示,“RISC-V有几件事要做好,一个是要把高性能做好,我们现在缺少真正能够在产业里面大规模量产高性能的芯片;另一个就是AI,因为AI原生的时代需要有可扩展性,实际上RISC-V可以把更多的硬件资源做计算的能力,天生就应该更容易把AI做好。”
硅谷传奇芯片架构师Jim Keller在玄铁RISC-V生态大会的在线视频演讲中也指出,“RISC-V的潜力是无限的。例如,未来我们会迎来前所未见的AI软件应用,而RISC-V有望打造出下一代的AI引擎。”
在2022年11月,达摩院就推出了首个支持Vector1.0的架构的高性能处理器内核C908,支持INT4数据类型,并全面优化AI算子及算法库。官方的数据称,C908典型神经网络计算的性能比前一代的C906提升了50%以上,在图像分类任务中性能相比C906更是大幅提升了3.5倍。
此次玄铁RISC-V生态大会,达摩院更是一口气推出了三款新的高性能处理器内核(其实在去年11月就已经公布):C907、C920和R910。其中,R910是达摩院首次推出的面向存储控制、网络通信、自动驾驶等具有高实时/可靠性应用领域的高性能处理器。C907和C920则主要面向高性能及AI应用。
具体来说,C907是一款专门面向人工智能应用的高能效处理器,首次搭载了全新的矩阵运算(Matrix)指令集,融合了Scalar、Vector、Matrix多维算力,与原有的Vector加速相比,FP32性能提升了4.15倍,F16性能提升了7.03倍。
C920则是达摩院首款搭载全新Vector 1.0引擎的旗舰级高性能处理器,大幅提升了AI方面的能力,其典型模型推理性能平均提升了1.63-4.6倍,可以跑 Transformer 模型,适合机器学习、自动驾驶等领域。
达摩院玄铁RISC-V团队资深技术专家李春强表示,“RISC-V是为AI而生的架构。达摩院玄铁团队在RISC-V方向上做了很多AI相关的工作,从C910的Vector 0.7到C920的Vector 1.0扩展指令设计实现。之后又大家一起进一步定义Matrix指令集,从性能方法学上,思考怎么样把RISC-V AI性能做得更高,并且以开源开放的方式,在RISC-V基金会上推进。同时在我们的玄铁C907上进行设计实现,包括对于大模型的支持,AI性能有4-7倍的提升。我们也希望通过这种扩展定义的方式,把CPU和AI的算力融合起来,使得AI的算法模型能够快速、便捷地跟RISC-V高效融合。”
同时,面对多Cluster(簇或集群)互联应用,达摩院在此次生态大会上还推出了玄铁多核高效互联的XT-Link,这是一款高带宽、可编程的多Cluster互联系统,可以有效降低多 Cluster系统互联数据传输所需带宽和软件编程难度、减少额外的Cache访问并优化系统功耗,为客户提供8~32核处理器扩展方案,支持大小核配置。
达摩院在此次生态大会上还首次披露了下一代的高性能旗舰处理器C930的部分信息,其将采用高性能乱序流水线,SpecINT2006成绩可达到15/GHz,预计将于今年年内推出。
资料显示,C920的主频最高可以到3GHz。以此来估算,C930单线程SpecINT2006成绩或许可以达到45分左右。作为对比,芯智讯查询到的数据显示,Arm Cortex-A78的单线程SpecINT2006成绩大约在39分左右,Arm面向服务器市场的Neoverse N1内核,在2.6GHz下,Arm给出的SPECint2006单线程性能是37分。同时C930还将兼容RVA24 Profile,支持虚拟化。
如此看来,玄铁C930或许将是一款可以与Arm Neoverse系列在服务器市场竞争的高性能处理器内核。
对于未来玄铁RISC-V家族的演进方向,达摩院透露,会继续面向低功耗、AI加速、安全以及车规等方向进行演进。
补齐玄铁RISC-V的软件及应用短板
正如前面所说,RISC-V要想在PC/服务器、移动终端、汽车等高价值市场,与X86、Arm进行正面竞争,首先就必须要突破性能上的瓶颈,但是这还远远不够,还需要解决关键的软件及应用生态上的问题。
首先,在围绕玄铁RISC-V处理器的硬件开发和工具链建设上,达摩院推出了“剑池编译及开发工具”,完成了从处理器IP到芯片平台、编译器、工具链等软硬件技术的软硬件深度融合。
其次,为了帮助客户降低玄铁RISC-V的开发难度、缩短产品研发周期,形成差异化竞争力,达摩院还推出了无剑芯片设计平台。据介绍,该平台j可以分担大约80%的通用设计工作量,让芯片设计厂商将精力集中在专用设计工作上。
同时,为了让客户能够充分发挥出玄铁处理器的AI能力,达摩院推出了面向多媒体AI增强场景的全栈软硬件平台XTAI(XuanTie AI), 支持对RISC-V vector、matrix及异构硬件引擎进行OpenCV、CSI-NN算子库和TMedia接口的融合抽象,深度融合多媒体处理流程,形成面向业务的流水线设计,为用户在流水线不同环节实现AI增强优化。平台还内置了物体检测、分类、超分、大语言模型等各类应用算法,方便客户快速调用。
在客户关心的安全方面,达摩院推出了玄铁VirtualZone软硬全栈安全平台,拥有面向不同领域的可配置、可扩展的安全软件栈,可自适应不同安全等级的应用场景。该平台还提供了软件沙盒保护、TEE软硬协同技术以及SE/TPM/HSM等安全硬件技术,实现了从软件隔离到逻辑隔离再到物理隔离的多层次弹性安全。
为便于广大RISC-V生态开发者和企业厂商随时随地体验和评估RISC-V全栈技术,达摩院还通过云-管-端的方式,推出了云上实验室,可提供云上RISC-V软硬件全栈技术综合测试及评估服务。
值得一提的是,在今天的玄铁RISC-V生态大会上,达摩院还联合Arteris、芯昇科技、新思科技、Imagination、中国电信研究院等头部企业及机构成立了“RISC-V无剑联盟”。联盟成员将基于玄铁处理器紧密推进IP协同、工具链优化、操作系统适配、解决方案拓展、应用推广等工作,持续降低RISC-V开发成本,缩短RISC-V产品及应用上市时间,让终端厂商以更快的速度找到更适配的RISC-V方案,实现更深度的软硬协同全链路应用创新,探索打造RISC-V产业合作新范式。
据介绍,在硬件开发和工具链建设上,基于“无剑600”芯片设计平台,Imagination和玄铁实现了高性能异构算力架构,产出一批高性能芯片;Arteris将与玄铁合作保证Arteris Ncore和FlexNoC片上网络互联IP及SoC自动化集成技术与玄铁RISC-V系列产品的互操作性;EDA厂商基于玄铁处理器开发出RISC-V仿真、调试、验证等系列工具,大幅缩短产品验证及上市时间,显著降低风险。
在操作系统方面,玄铁RISC-V 已基本完成与Android、Linux、Debian、OpenHarmony、Fedora、Gentoo、Ubuntu、龙蜥、统信、openKylin、创维酷开系统、RTT 等国内外主流操作系统的适配,并在百余款量产芯片中得到了应用。
据介绍,在适配Android过程中,阿里巴巴累计进行了12万余行代码的修改,对73万余个testcase作了测试,在推动RISC-V正式接入安卓开源生态的过程中发挥核心作用,谷歌Android官方接受的首批RISC-V补丁就来自阿里巴巴。预计,首款基于RISC-V的Android设备也将于2024年大规模商业化落地。
在解决了主流操作系统的适配问题之后,还需要解决主流软件应用的兼容性问题。据介绍,在达摩院及相关软件合作伙伴的努力下,目前玄铁RISC-V处理器已跑通钉钉、福昕PDF、搜狗输入法等商业应用,持续扩大RISC-V的软件应用生态。其中,钉钉是第一个在玄铁RISC-V上跑通的商用IM产品。
“我们在做玄铁RISC-V跟主流操作系统结合的过程中,不是做简单的移植,其还包括性能的优化、功耗的优化,都是在往产品化的方式推进,这就是我们在软件生态的维度上持续布局做的工作。我们认为到目前为止,这还是一个阶段性的,后续还会往产业化方向做更多的事情,最终要让我们的合作伙伴在RISC-V的生态中真正赚到钱,这是最关键的,包括后期怎么在RISC-V做更多的原生,包括操作系统上做原生。”李春强解释道。
值得一提的是,在2023年6月,由谷歌、英特尔、达摩院等13家企业发起的全球RISC-V软件生态计划“RISE”正式启动。RISE旨在加速RISC-V新架构的软件生态建设及应用商业化进程,成员将联合推动RISC-V处理器在移动通信、数据中心、边缘计算及自动驾驶等领域的市场化落地。
随着玄铁RISC-V在高性能领域的突破,以及软件生态的补齐,基于玄铁RISC-V的产品应用生态也得到了快速的拓展。
比如,在去年3月,国产RISC-V服务器厂商算能科技就正式发布了首款基于玄铁RISC-V内核(C920)的服务器。
在此次玄铁RISC-V生态大会上,中国电信研究院携手达摩院完成了中国电信操作系统 CTyunOS(可作为服务器操作系统、虚拟化云主机操作系统使用)与玄铁RISC-V适配,并在64核玄铁RISC-V CPU板卡成功运行。同时,双方还合作研发完成基于RISC-V的边缘AI计算盒子TeleBox,成本较传统方案降低20%以上。
中国科学院软件研究所则发布了首款基于玄铁C910的开源RISC-V笔记本电脑“如意BOOK”,首次打通了从底层芯片到操作系统到商用软件的RISC-V全链路,且全部开源开放。随着该开源RISC-V笔记本电脑的推出,有望加速桌面级软件应用生态的完善,助力RISC-V迈向通用计算生态。
如意BOOK中国科学院软件研究所RISC-V行业生态负责人郭松柳表示:“我们期待更多开发者基于如意BOOK进行原生RISC-V开发,共同丰富RISC-V的软件应用生态。”
达摩院还携手openEuler社区及亚博科技推出了基于玄铁处理器的Mlik-V Meles开发板研发建图与避障导航小车,推动RISC-V首次进入ROS机器人领域。
国网智芯公司基于玄铁RISC-V处理器研发了面向工业应用的高能效、高安全、高可靠AI芯片,可应用于变电智能巡视、源网荷储协同调度等场景,全面赋能数智化电网建设。
广东匠芯创科技有限公司展示了其基于玄铁RISC-V处理器开发工业MPU MCU方案,包括D21x系列工业级MPU和D13X系列跨界MCU的相关解决方案。据悉,已完成百万级级规模出货,获得了很多工业自动化客户的认可。
嘉楠科技展示了其基于玄铁C908研发的中高端立体视觉AI芯片K230,这也是全球首款支持RISC-V Vector 1.0标准的商用量产端侧AIoT芯片。
达摩院玄铁RISC-V团队还与润开鸿联合推动RISC-V架构与Openharmony操作系统的融合发展,双方联合打造了从芯片到操作系统的全栈安全能力,并在玄铁RISC-V架构上更好地发挥了OpenHarmony分布式技术应用优势。目前已经在金融、交通、智慧城市、智慧园区、医疗、教育等行业实现了商业化落地。
达摩院院长张建锋表示:“随着新型算力需求激增,RISC-V发展迎来蝶变,即将进入应用爆发期。达摩院将持续加大RISC-V的研发投入和生态共建,推动行业上下游协同创新发展。”
玄铁RISC-V生态进入3.0时代
在芯智讯看来,RISC-V最初凭借其在低功耗、高能效、低成本上的优势在物联网领域站稳脚跟,属于是“RISC-V生态1.0时代”,即RISC-V生态实现了从0到1的阶段,但是这个阶段的RISC-V生态是跟物联网市场一样,是“碎片化”的。
而随着RISC-V在高性能方向上的突破,并成功接入Linux、Android等主流生态系统,RISC-V生态就开始步入了2.0时代,即RISC-V生态实现了从1到10的阶段。而达摩院正是RISC-V生态实现从1到10这个阶段的重要推手。
其中,最具标杆意义的事件,则推动是RISC-V对安卓的兼容。2020年,平头哥内部就启动了玄铁910处理器兼容安卓系统的项目,2021年初在全球范围内首次流畅运行安卓系统的基础功能。2022年,谷歌与平头哥达成公司层面的贡献者许可协议(CLA,Contributor License Agreement),双方就安卓系统支持RISC-V架构等工作进行技术合作和分享,RISC-V移植安卓的代码还被安卓AOSP社区收录进系统源代码,这也是安卓官方首次对RISC-V架构的原生支持。
孟建熠告诉芯智讯:“为了推动RISC-V接入安卓生态,达摩院花了三年多的时间一直不停地在做,等到做完以后,谷歌才相信了这个事情。后续安卓对于RISC-V的支持再往前走,就不需要达摩院再来花大精力推进了,更多的将是由谷歌来做。而谷歌做的可能就是从10-100的事情,但是达摩院确实对从1-10的阶段做了更多的贡献。”
更为关键的是,作为RISC-V基金会最高级别的会员(Premier Members),达摩院还推动了RISC-V众多相关标准的制定。在2023年的玄铁RISC-V生态大会上,达摩院就曾表示,其在RISC-V基金会中的数据中心、存储管理、安卓、安全等11个技术组织当中担任主席、副主席的职位,推动了29个技术方向的标准制定,同时还在努力推动RVV1.0架构标准、面向人工智能的全新Matrix矩阵标准以及RISC-V安全技术标准等,是公认对RISC-V投入最大的中国半导体公司。
在今天的玄铁RISC-V生态大会上,达摩院透露,其在2023年就参与35个技术组工作组,领导了2个技术委员会,以主席/副主席身份主导了多个技术组的标准制定。相关关键标准的制定也正是推动RISC-V生态进入从10-100这个阶段的关键。
此次玄铁RISC-V生态大会的主题是“开放·连接”,目的就是要推动玄铁RISC-V生态进入全新的3.0时代,即实现从10-100的阶段。
“从1-10和10-100的核心都是生态产生裂变,但是从1-10的阶段,需要有理想有信念,坚信这个事情可以成功的公司去做。但是,如果只有自己做,也只能做到1-10,只有别人都跟进来做,才可以进入从10-100的阶段。而达摩院认为玄铁RISC-V生态正慢慢走向从10-100阶段的底气,正是源于越来越多的客户在使用玄铁RISC-V的技术。当然,不仅是达摩院在做RISC-V,别的头部厂商也在做自己的RISC-V生态,但是这些都是在推动整个RISC-V生态的发展,让RISC-V接受度越来越高,这也给从10-100奠定了越来越高的基础。”在孟建熠看来:“老牌的使用Arm等架构的公司存在历史兼容的包袱,但是新创公司选择RISC-V的概率在大幅提升,今天看到很多很多新的公司、新的创意、新的架构都是基于RISC-V在做。”
从达摩院公布的目前玄铁RISC-V的授权及累计量产数据来看,似乎也反应了玄铁RISC-V生态正在进入从10-100的更加繁荣的“3.0时代”。
“达摩院玄铁团队更多做的是从1-10这个阶段的事情,比如把RISC-V处理器内核紧密相关的技术做上来,比如推动RISC-V接入到主流的系统生态,但是我们的力量肯定是有限的,所以后面的各种操作系统的优化、软件的适配、应用的开拓,其实更多的是操作系统厂家和开发者需要做的事情。比如,在此次开发者大会现场展示的应用案例,包括智能小车,ROS机器人,我们一开始都没有想到他们会有这样推进,所以我们看到的正是玄铁RISC-V生态从10-100这样的裂变,我们需要依靠生态的力量推动玄铁RISC-V加速前进。”李春强兴奋的说道。
编辑:芯智讯-浪客剑