来 源:雷科技数码3C组
编 辑:三明治
排 版:江省
国内的半导体技术到底是什么水平?
四五年前,如果你在问答平台上面发起这样一个问题,可能并不会得到多少回复。当时的我们已经习惯了国外的半导体。英特尔/AMD的处理器、Nvidia/AMD的显卡,对当时的我们来说就是理所当然存在着的事物。除了部分特定领域的投资者外,甚至不会有多少人关心国产半导体的发展情况。
然而近些年来,随着中兴、华为事件的发酵,国人深刻地感受到了所谓“缺芯之痛”,这也让国人对于国产半导体的关注也来到了一个顶峰。只可惜时至今日,全球芯片格局仍被欧美日韩牢牢把控着。至于龙芯和一众民族芯片企业,只能使出浑身解数,在夹缝中寻找一丝微弱的光亮。
近日,国产知名芯片制造厂商——龙芯中科公司在互动平台回答投资者关于龙芯3A6000研发进度的提问时表示,下一代处理器产品龙芯3A6000目前研发进展顺利,已经完成前端设计及仿真验证,仿真结果表明其单核性能可以达到市场主流产品水平。
作为国产芯片自研队伍中重要的参与者,龙芯以其自研的LoongArch指令集架构而著称,是不少国内开发者比较看重的有生力量。那么问题来了,全新的龙芯3A6000到底有怎样的性能提升呢?龙芯中科坚持自研指令集会有哪些优势,又会带来哪些问题?
超越Zen 3的“龙”?
在开始前,我们先来稍微介绍一些龙芯中科这家公司。正如公司后缀所展示的那样,龙芯处理器最早是在2001年由中科院计算所研制的一款芯片,而龙芯中科则是在2008年由中科院和北京市政府共同牵头出资成立的芯片公司,旨在将“龙芯”处理器的研发成果商业化。
去年4月,龙芯宣布放弃了一直以来采用的MIPS指令集,转而推出了自研指令集架构Loongson Architecture,简称龙芯架构或LoongArch。LoongArch的出现,打破了国内芯片还在使用ARM授权/老旧X86指令集的现状,为我国系统架构的发展开启了新的纪元,而龙芯3A6000就是采用这款架构的最新产品。
(图源:龙芯)
根据目前爆料显示,龙芯3A6000将会采用和龙芯3C5000服务器相同的12nm工艺,但会大幅改进架构设计,将CPU架构会从目前的GS464V升级到LA664,以此提升单核运行频率和性能表现,同时可能会上SMT(龙芯超线程技术),这样就能达到最高4核心8线程的规格。
(图源:龙芯,可见频率>2.5GHz、采用四个LA664核心)
那么性能方面呢?龙芯基于新架构和工艺做的仿真测试结果显示:龙芯3A6000处理器的单核SPEC CPU 2006定点/浮点base分值从26/28分提高到35/45分,分别提升37%及68%。
(图源:龙芯)
所谓SPEC CPU性能测试,本质是针对CPU定点运算/浮点运算进行的一系列测试,其中绝大多数测试项都属于科研用途的科学计算,和一般用途完全不搭边,但还是能在一定程度上反映CPU的性能表现。如图所示,龙芯3A6000的定点算力和开启睿频的桌面端i5-6400非常接近,但是距离最新的移动端CPU仍有一定距离。
(图源:龙芯吧@gueenet)
此外,还有业内人士分析称,龙芯3A6000处理器的IPC将达到AMD Zen3或11代酷睿的水平。所谓IPC,指的是CPU每一时钟周期内执行的指令数,这个数据和处理器频率(时钟速度)共同决定了CPU性能。换言之,在相同处理器频率的情况下,IPC越高处理器性能就越高。
那么问题来了,如果是3A6000的IPC真的能够与Zen3媲美,那是否说明3A6000在性能上就能够媲美Zen3处理器呢?答案显然是否定的,正如上文所述,IPC性能是一个重要的指标,但是CPU主频一样重要,只要其中一项数据无法并驾齐驱,那么真实性能就不可能相等。
举个例子,目前AMD的Zen3处理器目前最低端的入门型号为Ryzen3 5400U,四核八线程,基准主频为2.6GHz,最大加速时钟频率为4.0GHz。作为对比,目前龙芯主频最高的在售处理器——龙芯3A5000的主频为2.3GHz-2.5GHz,而龙芯3A6000的主频据传为2.5GHz-2.8GHz,制程工艺的落后导致了主频的巨大差距,而主频的巨大差距意味着即使两者的IPC性能相当,3A6000的最高性能也远不如Ryzen3 5400U的正常最低性能。
想要超越Zen3的性能表现,对目前的国产处理器来说多少有些好高骛远了。
坚持自研,并不容易
最近两年,国产CPU火了。
根据市场调查显示,在2020年至2022年,有多家CPU创业公司成立,并获得多轮高额融资,其中包含了主打Arm架构服务器CPU的遇贤微、基于Arm架构研发PC领域CPU的此芯科技,以及集聚来自英特尔、华为鲲鹏和阿里平头哥等多家芯片厂商老将的鸿钧微。个个都在摩拳擦掌,期待能够大干一场。
在这之中,龙芯中科无疑是被市场尤其看好的一家厂商。今年6月24日,在经历近一年的IPO审核后,龙芯中科在科创板挂牌上市,成为了“国产CPU第一股”。首次发行共计4100万股,发行价为60.06元,首日涨幅接近50%,这也使其市值一度超过400亿元。
让龙芯中科备受关注的要点,除了切实推向市场的消费级产品外,最重要的还是其坚持自研的决心。然而自研的龙芯架构,在让龙芯摆脱MIPS/ARM/X86等通用架构掣肘的同时,也把龙芯悄然拖进了一个急需和产业链对接、建立与之相匹配生态系统的困局中。
无论有多少争议,目前市面上最多消费者使用的操作系统都是Windows系统,这是一件不容置疑的事实。凭借着强大的X86软件生态和性能强劲的X86处理器,微软和英特尔组成的Wintel联盟在消费级市场上可谓是无往不利,在全球通用CPU市场牢牢霸占着八成市场。
作为对比,龙芯此前使用的是MIPS指令集,只能安装linux系统,无法安装windows,因此很难打开C端消费市场。随着自主LoongArch指令集的出现,现在就连,使用linux系统也要重新进行调整,除了国产统信UOS及时适配外,很多linux软件都无法直接安装,需要再度优化和适配。
为了解决这个问题,龙芯不但在努力进行各种主流软件的适配工作,而且还在积极推动二进制翻译系统的开发,希望通过类似Rosetta 2的转译功能,将X86、ARM指令集转译成龙芯能够识别读懂的指令集。可是转译必然会带来性能上的损失,再考虑到兼容性问题,和强大的Wintel联盟相比,龙芯生态的软件仍然十分贫乏。
总结一下,自研芯片并不是件容易的事情,而打造自研的指令集、核心IP显然更加困难。就龙芯处理器而言,固然它存在着很多问题,性能上和英特尔AMD相距甚远,应用生态的丰富程度更是有着天壤之别,但是龙芯确实在自研、商业化上走出了自己的道路,在残酷的市场上努力生存着。我们只能寄希望于统信、清华同方等企业加把劲,携手把系统和软件生态搞好,让国产处理器和周边应用生态变得真正可用、甚至好用起来。