2023年是国产CPU性能爆发式提升的一年,无论是X86、ARM路线CPU,还是自主指令集CPU,其IPC和单核性能均大幅提升。国产CPU性能已经足以满足日常使用,在信创市场的大部分应用场景中已经性能过剩,各家CPU呈现出你追我赶的态势。
龙芯
龙芯发布了3A6000,这款CPU的SPEC06定点成绩达到43+,在IPC上的飞跃是最让人惊骇的,从3A5000的10+/G,一下子提升到17+/G,在IPC上追平英特尔13代酷睿,在单核性能上,2.5Ghz的3A6000就足以打平3.6Ghz的10代I3。有鉴于爱好者把3A6000的主频提升到2.7Ghz,以及华硕主板+散热改善后可以把主频提升到3Ghz,足以证明3A6000的巨大潜力。
另外,基于LA664开发的3D6000,这款服务器CPU的潜力非常巨大,由于服务器CPU的主频普遍偏低,这会抹平龙芯在主频上与英特尔的差距。明年流片的3B6000,规划是微结构小改,工艺保持不变,IPC达到20/G,主频2.5G,SPEC06定点超过50分。这个单核性能将继续领跑国产CPU。3B6000发布后,龙芯市场推广的最大问题已经是不再是硬件性能,还是软件生态。
SW
SW由相关单位设计,在超算上非常成功,神威超算多次在TOP500上名列第一,由于种种原因,SW的相关信息官宣甚少。申威用实践证明,独立自主与CPU高性能可以兼得,没必要一定依附于X86和ARM,中国人自主定义指令集完全走的通。
飞腾
飞腾今年发布了S5000C。根据此前PPT,S5000搭载FTC860核,2.8GHz,SPEC06不少于25分。由于失去台积电流片渠道,只能选择境内工艺,因而主频有所降低,在官方PPT上,S5000C的成绩是SPEC06不少于22分。
另一个PPT上,S5000C的核心是FTC862核,采用境内工艺,宣称是境内设计,境内流片,首个国产工艺DDR5和PCIe5.0。单核成绩为31.9,这比此前公布的不少于22分高了30%以上。
有鉴于SPEC17测试中,使用phygcc编译器,FT2000/4能跑到3分,而gcc下测试成绩为1.93,phygcc编译器的优化效果堪比ICC对X86的优化。
因而存在2个可能,一是FTC862比FTC860强30%以上,二是FTC862单核SPEC06 31.9的成绩同样使用了phygcc编译器,并且开了一些优化选项。
当然,能够通过编译器优化也是本事,毕竟最终用户体验等于软件+硬件,只要phygcc的代码能够被纳入GCC最新版本,被大家广泛使用,或者phygcc能够在特定领域小范围推广开,那么这种优化就是有效的。如果phygcc只是敝帚自珍,开源软件和商业软件都不用,那么这种优化跑分就只能像ICC跑分那样自娱自乐了。
总结一下,S5000C的IPC实现了大飞跃,这个IPC已经很不错了,FTC860核可以对标ARM A76,FTC862性能在ARM A76和A78之间。
铁流倾向于FTC862略强于FTC860,但和ARM A78有差距,这一点从官方PPT上,在制造工艺从台积电7nm变成成熟工艺后,S5000的SPEC06 int是不少于25分,而S5000C的SPEC06 int是不少于22,这可以看出来,两者是同一代,而且在工艺降级后主频下降,单核性能也随之下降。
从以往的PPT上,FTC862只是FTC860同一代小改版本,CPU基本框架差不多,IPC提升30%的性能差距必须是CPU核换代才行,SPEC06 31.9的成绩高概率是phygcc编译器下跑出的成绩。
不过,无论是单核22+,还是单核31.9,对于信创来说已经够用了,在单核和多核上,相对于上一代S2500、FT2000/G等CPU都是巨大的提升。
兆芯
2023年,兆芯发布了KX-7000,KX-7000在目前所有国产CPU中主频最高,基频3.0到3.2Ghz,最高工作频率3.7Ghz。据网友跑分泄露,spec06(@3.7G)定点超过40分,IPC达到10+/G,在IPC上相对于KX-6000提升巨大,已经接近第二代锐龙。
相对于其他国产CPU,KX-7000集成了GPU,支持DirectX12、OpenCL 1.2、OpenGL 4.6以及H.265硬件编解码,最高支持双路4K显示。这会使兆芯电脑不需要额外独立显卡,降低了整机成本。
在信创市场中,兆芯spec06 40分的性能已经明显过剩了。过去,兆芯的IPC只有6/G,这次IPC提升到10+/G,提升巨大,也许正如AMD开发出锐龙一举翻身,兆芯KX-7000会使改变公众对兆芯的既往印象。
由于兆芯一直有价格优势,只要兆芯继续发挥这方面的优势,进一步压缩成本,加上其X86指令集能跑Windows,做一些上网本、电脑盒子,是非常有希望进入商业市场的。
结语
从实践上看,无论是技术引进CPU,还是自主路线CPU,在IPC上均有跨越式进步,都已经跨入10/G门槛。5年前,10/G还是国产CPU的目标,不过5年的时间,10/G成为了国产CPU的及格线。由于单核性能对CPU和用户体验最为关键,铁流对国产CPU与英特尔、AMD CPU单核性能做了对比和盘点。
总体来看,龙芯和兆芯已经达到40分,国产ARM CPU稍逊一筹,单核成绩在22-31分。相对于英特尔13代I3 单核(int)67分的成绩,国产CPU尚有较大提升空间。
未来,比拼的重点在各家CPU的发展后劲,比拼的是技术能力和更新速度。考虑到大陆的制造工艺水平,如果采用12nm工艺的情况下,60分会是一个坎,如果采用5/7nm工艺,70分会是一个坎。当国产CPU把单核性能提升到60-70分水平,也就是追平13代酷睿,这个性能已经足以满足3A游戏需求,届时,国产CPU也会像英特尔那样“挤牙膏”,会更重视降低功耗,降低芯片面积,降低CPU成本。
从国际大环境上看,由于俄乌和巴以冲突,美国在对外干涉上已经比较乏力。只要台海不爆发冲突,美国对华制裁的烈度在几年内不会超过前几年。技术引进CPU再度发生“绝版”的概率偏低。在中美斗而不破的大环境下,引进CPU的风险会大幅降低。这样一来,国产CPU将进入比拼性能、价格、生态、服务的阶段。
有鉴于几家国产CPU均走上正轨,只要在更新2-3代,把单核性能提升到13/14代酷睿水平,把成本和价格压下来,把软件生态进一步丰富,5年后就希望依靠性价比侵蚀英特尔、AMD的市场份额。