如今,视觉体验的应用无处不在,不论是游戏、工作、还是生活的其他方面。Arm近日宣布推出 2022 全面计算解决方案 (TCS22),可提供不同级别的性能、效率和可扩展性,以完善各类终端市场的用户体验。此外,Arm 推出了全新旗舰级GPU产品 Arm Immortalis,这是首款可在移动端支持基于硬件的光线追踪的GPU,可提供更为真实的沉浸式游戏体验。
据了解,TCS22的Arm IP 组合可在一系列工作负载中实现 28% 的性能提升,并可降低 16% 的能耗。
Arm 全面计算解决方案优化视觉体验
如今,智能手机已经是当之无愧的视觉体验的核心,移动端成了最大的游戏平台,移动游戏成为最大的游戏市场。
2022年,Arm在移动领域开展了许多新举措,其中就包括游戏。Arm 首席执行官 Rene Haas表示:“游戏的核心在于极为丰富的视觉体验,我们现在的投入将切实影响到未来的视觉体验。Arm 致力于能效,这是我们的DNA,是我们所做一切的核心,并且在视觉体验与视觉游戏方面越来越重要。”
Arm 高级副总裁兼终端事业部总经理Paul Williamson表示,移动游戏非常强调性能极限,随着相关性能与需求的增长,持续的性能表现成为游戏的关键指标。正是如此,Arm在CPU、系统IP和GPU上提供全面优化,来促进性能的提升。
伴随2022 全面计算解决方案的推出,Arm配置了最新的CPU、GPU IP,以及相关的工具、软件生态系统、实体 IP 和通用标准,旨在打造出灵活且扩展性高的解决方案,满足从台式机到轻量级 AR/VR 设备之间广泛的价格区间。他强调,作为核心基础平台的延伸,全面计算解决方案支持这些市场的专用计算能力。也只有通过系统层级的优化,才能提供更好的体验,为用户开启全然不同的视觉世界。
Paul Williamson介绍,Arm全面计算战略专注于计算性能、开发者对性能的可及性以及平台的安全性。这在MediaTek的天玑 9000 SoC中已经得到了展现,它基于Armv9,被OPPO和vivo用于其高性能智能手机,已经实现了领先的性能体验。
Arm史上性能最强GPU问世
移动设备的创新推动了移动游戏的迅猛发展,视觉效果出色的 AAA 游戏的兴起也要求相互匹配的性能表现,从而又推动了相关硬件平台的升级。
全新旗舰GPU产品Immortalis在Mali技术积淀的基础上进行了配置和增强,旨在提供更好的移动 3D 体验。同时,Arm发布了高端 Arm Mali-G715 GPU,提供当前新款GPU都具备的可变速率着色 (Variable Rate Shading) 图形功能,能够显著降低能耗,并进一步提升游戏性能;还有Arm Mali-G615,将为更广大的开发者和消费者更快地带来高端的移动应用场景、功能和特性。
据介绍,Mali-G715和Mali-G615将提供比去年旗舰级GPU更高的性能,天玑9000已在游戏中展现出了领先性能,正在用更丰富、更深入的视觉效果来推动性能的极限。
与前一代产品相比,最新的 Arm GPU性能提升15%,是迄今为止 Arm 性能最强的 GPU。Paul Williamson介绍,Immortalis是Arm全新的旗舰级GPU,它具备了基于硬件的光线追踪功能,并将以出色性能表现支持安卓游戏生态系统。
新的 GPU 同样基于高效的Arm Mali-G710 GPU构建,且能效优化了15%,提供更长的游戏时间。它们还将提供2倍的机器学习能力,以实现更多的智能应用和更出色的用户体验。
GPU 增加光线追踪,是否会额外增加手机的功耗?Paul Williamson表示,Arm的光线追踪单元旨在为效率而打造,只占用了约 4% 的着色器核心面积,且仅耗费非常小幅的功耗,却能在相关领域带来 300% 的显著性能提升。
Armv9 CPU:提供高端出色的持续性能和效率
Arm在 2021 年推出了首批Armv9 CPU。今年,针对市场对性能和效率的需求,Arm推出了新的扩展CPU集群,新CPU 设计旨在提升峰值性能,并提供出色的持续性能和效率。
据了解,新的 Arm Cortex-X3 可面向广泛的基准和应用市场,与最新款的安卓旗舰智能手机和最新的主流笔记本电脑相比,其性能分别提升了25%和34%。
Arm Cortex-A715 专注于高效性能,与 Cortex-A710 相比,其能效提升了 20%,且性能提升了 5%,达到了可媲美 Cortex-X1 性能的重要里程碑。考虑到高效性能的重要性,Cortex-A715 的 CPU 集群采用了基于大小核 (big.LITTLE) 的配置,这也是目前全球消费级设备最常用的异构处理架构。
基于 Armv9 架构的 Arm Cortex-A510 在 2021 年推出,这是 Arm 四年来推出的首款高效小核。今年的更新版本在保持性能不变的同时,将功耗降低了 5%。同时,与去年的上一代产品相比,更新版的 DSU-110 所支持的 CPU 集群内核数增加了 50%,实现了不同等级消费级设备的可扩展性。
Arm 架构是移动游戏的基石
Paul Williamson指出,Arm全面计算是面向系统范围的方法,其中包括所有囊括在内的Arm产品,从而进行全面优化设计。针对具体用例,Arm会对其工作负载以及它本身的局限性进行深入了解。也就是说,对方案中涉及的Arm产品(包括编译器、IP、开发人员的工具等)进行优化时,就能确保所建模的工作负载能够在实际性能中实现。这一方法在于理解每个应用都有其独特的需求。只有对系统上的各项组件进行优化,才能实现最佳性能。
以游戏为例,这就是一项系统级别的工作负载,重要的是衡量系统相关的指标,而非个别IP。在一个游戏示例中,通过基于8核CPU集群进行测量,在DSU上共享 8MB L3 缓存,并运行于安卓S 的软件栈。在2022全面计算解决方案中,可以看到高达23%的DRAM带宽减少,显著改善了缓存大小与游戏工作负载,同时改善了效率并最终延长游戏性能续航。与 2021 全面计算解决方案相比,系统能耗减少了16%。这一重大提升,将为百万级移动游戏开发者带来进一步的持续游戏性能表现。并且,最终在不同工作负载中的测试,性能可显著提高28%。“这些都是来自于系统层级优化的结果,我们的2022全面计算解决方案,已成为赋能沉浸式游戏体验的架构”,Paul Williamson补充,“迄今为止,Arm Mali GPU出货量已超过80亿颗,Arm架构成为移动游戏的基石。”
Paul Williamson指出,性能效率是将视觉体验应用到各处的关键,而今天,实时 3D 游戏是主要的驱动力。如果要将游戏应用从智能手机转移到 AR、VR等其他领域,则需要游戏世界的开发者和创作者将他们的经验应用其中。因此,Arm一直与Unity等伙伴合作,致力于通过最新的IP,为开发者带来基于Arm架构的终极视觉体验。
2022全面计算解决方案三项原则
Arm 2022全面计算解决方案有三项原则值得关注,也将对其生态动向进一步产生影响。
首先是性能方面,如果用户对性能有高要求,Arm倡导需要迅速过渡到64位。64位方面,过去其开发者生态系统的就绪程度还有一些犹豫不决。随着近期OPPO、vivo 和小米等公司参与的中国金标联盟的宣布,中国的计算生态系统和应用生态系统已全面就绪 64 位,这意味着未来几年的旗舰级智能手机都需保证为全64位设计,以确保获得更好的效率和更强的性能。
其次是开发者的可及性方面,最新的IP在机器学习性能方面进行了更新或提升,为了确保开发者能够获得这些性能,Arm将持续致力于 Arm 计算库和 Arm NN 框架,以确保开发者能访问这些性能。无论是在 GPU 中的矩阵乘法的改善,还是系统级优化和设计中其他地方的缓存微调中,Arm NN 和 Arm 计算库让开发者能获取这些性能。
最后是安全性。Arm一直在加强处理内的安全性,已经推出了非对称内存标签扩展,这被认为是去年推出的同步MTE和异步MTE的结合。Arm还将这些保护措施扩展到设计中较小的可信执行环境中,这也是系统执行软件栈中可能最具安全意识的组件,例如人脸解锁和面部识别功能,需要确保免受额外的恶意攻击。在新一代产品 ,Arm将这些安全增强引入设备的可信执行环境中,安全功能将在这个环境中运行。
中国的移动计算生态是否对64位时代做好准备?
根据Arm 2022全面计算解决方案三项原则之一,倡导出于更高的性能要求,需要迅速过渡到64位。那么,如何看待中国的移动计算生态对64位时代所做的准备?
Paul Williamson认为,不仅是游戏,所有应用都应该尽快过渡到 64 位。中国市场在这方面已经取得了良好进展。中国主要的应用商店已表明,到今年 8 月,所有新上架的应用都应该是 64 位的。
事实上,64 位应用能够为用户带来更好的体验,同时,在应用启动时间方面也能够加快20%。任何没有过渡到64位的应用都会因为性能上的欠佳,让用户感到失望。他补充,期望所有的应用都过渡到64位,同时也对目前中国应用商店合作伙伴所取得的进展感到欣喜。