2020~2021年,受疫情下居家影响,手机游戏消费基数被提前抬高,2022年全球通胀下生活成本支出不断提升,两者夹击压缩2022年的全球智能手机销量和游戏娱乐支出,全球手机游戏行业收入呈现见顶下滑态势。
图 | 全球手机游戏市场规模
信源:Statista,Sensor Tower,世界银行,华安证券研究所
但从产业发展的角度来看,手机游戏行业市场规模还未饱和,在未来几年中有望维持稳步自然增长。根据ABI Research发布的2022年调查数据显示,手机游戏用户将会从现在的26亿增长到2030年的39亿,到2026年,85%的游戏玩家将首选在手机上玩游戏。无独有偶,Statista等机构预测,2030年全球手机游戏市场空间有望达到1566亿美元(2021年876亿美元,21-30 CAGR 6.7%)。
手机游戏有三大趋势值得重点关注:一是追求真实的沉浸感体验,画面更细腻;二是追求更流畅的体验,整体性能要提高;三是功耗要降低,手机续航要持久。前面两点,我们可以将桌面游戏中的一些技术演进借鉴到手机游戏中,最后一点必须单独攻关。而这三大目标,也给手机用GPU提出了更新的要求。
日前,Imagination就将其最新的GPU技术和这三大趋势做了一个一一对应,并在此基础上推出了最新的移动设备用GPU——IMG DXT系列。
图 | GPU技术和三大趋势
从上图中可以看到,我们可以采用2D Dual-Rate Texturing(2D双速率纹理处理)、Scalable ray tracing(可扩展的光追)和ASTC HDR support来提升手机游戏用户的沉浸感体验;采用FSR(片段着色率)技术、2D Dual-Rate Texturing、Pipeline Data Masters和更高配的性能和运算能力来提升手机游戏用户的流畅感体验;采用FSR和2D Dual-Rate Texturing来进一步降低游戏时的手机能耗,延长其续航时间。
那为什么这些技术可以起到相应的效果呢?下面我们具体来分析一下:
- 2D Dual-Rate Texturing(2D双速率纹理处理)
在游戏中,有了画面以后需要在游戏后处理阶段进行额外的处理,降噪或者Super Solution,许多先进的游戏依靠大量纹理取样实现高级过滤效果。当引入2D Dual-Rate Texturing后,相当于开通了一条“快速通道”,在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。如此,GPU不但可以加速诸如游戏后处理和计算图像学应用中的滤镜效果;更高的吞吐量也有助于实现更快、更低功耗的降噪算法,提高光追画面的质量。
- Scalable ray tracing(可扩展的光线追踪)
所谓光线追踪,就是用计算来模拟“每一条”光线运行的轨迹、效果,比如光线的反射、折射、散射和色散等,从而来实现无限逼近于真实的画面光影效果,让已经开到顶的3A大作能够看起来更逼真。
近几年,光线追踪已经成为各大手机厂商追求差异化竞争优势的靶点。由于这些光线的折射和漫反需要很大的资源开销,早期即使高端的服务器也需要一定时间烘焙这些画面,慢慢地在桌面上已经拿到实时渲染的光追技术现在要拓展至移动设备领域,就会面临更多资源和功耗的问题,所以目前主要是旗舰手机在用。
对于更多的非旗舰机的用户,难道就不配拥有光追效果吗?非也,IMG DXT系列就带来了可配置的硬件光线追踪RAC(光线加速集群)。从0.5 RAC到4 RAC,可涵盖从混合实现方案中的简单阴影到3A大作中的高级光追画面等各类应用。
- ASTC HDR support
通过引进硬件级HDR,标准API支持,可以让画面的亮度、对比度更加真实。此外,为了最大程度地提高带宽效率,IMG DXT系列支持更多的压缩技术,其中就包括Khronos ASTC HDR,这项技术能够扩大纹理在明暗区域之间的动态范围,同时保留细节。
- FSR(片段着色率)
GPU中的片段着色器将场景中的颜色绘制到帧缓冲器上。FSR是一种可以在几乎不降低图像质量的前提下减少片段着色器运行次数的技术,能够降低占用的带宽与功耗。开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,从而使工作负载减少近94%,实现同等的功耗和带宽节省。所解放的性能使开发者能够利用硬件来完成更多的内容渲染,为玩家打造更高质量的游戏体验。
- Pipeline Data Masters
Pipelined Data Master会带来全域性的画图和计算5%的性能提升,关键点在于之前有一个Data Master运行的时候另外一个就要等待,现在有了这项技术,前面Data Master运行,后面一个任务就可以提前准备好,所以调度的间隙就会很小,可以带来5%的性能提升。
- 更高的性能和运算能力
IMG DXT GPU搭载全新的着色器处理单元(SPU)。SPU是一个硅片,包含一个用于计算任务的算术逻辑单元(ALU)和一个用于像素着色、几何处理和光栅化逻辑的纹理处理单元(TPU)。
凭借全新三重通用着色器集群(USC)设计(3个ALU/TPU单元),DXT GPU将每个SPU的高端计算和纹理(ALU/TPU)性能提升50%以上,而以前的架构只侧重于双USC设计(2个ALU/TPU单元)。这个改进后的模块使Imagination能够创造出最高性能的高端移动GPU--DXT-72-2304,这款GPU在1GHz时钟频率下具有72GTexels/s和2.5TFLOP FP32性能。
图 | 光线追踪功能开启前后效果图对比
值得一提的是,光线追踪技术可以被分为五级。Imagination首席营销官David Harold透露:“现在市面上能够看到的任何宣称有光线追踪技术的手机,其实用的都还是第一级别的软件解决方案,真正使用起来能耗会非常吓人。”
参考Imagination在2021年发布首款硬件级光线追踪GPU IP 时提出的光线追踪等级系统(RTLS),如下图所示:
图 | 光线追踪等级系统
具体区别是,第1级为现有硬件上的软件解决方案,开销比较大,CPU占用资源比较高;第2级增加了对一些光合或者三角形碰撞用硬件处理DTTU+PTU,节省了CPU资源,目前典型的桌面显卡都是这项技术;第3级增加了用以处理发射光线的硬件,有了PCG也就是相关的分析、分类、聚集和对BVH的回溯能力,与第2级解决方案相比,可大大降低功耗;第4级增加了光线存储、光线任务的调度器以及相干性聚集功能,把相同光线上的光束统一计算,可以用统一的指令运行,大大提升了计算性能,让其可以在移动端功耗预算下应用;第5级是一项未来等级,可在场景中实现更大数目的动态目标,并带有额外的硬件加速。
图 | IMG DXT系列产品型号
据悉,IMG DXT系列就属于第4级,该系列的旗舰产品DXT-72-2304能够提供超高端移动设备所需的性能,具有72 GTexels/s和2.5 TFLOP FP32算力。与上一代产品相比,其最大单核性能提升了50%。DXT核的单位面积性能密度比IMG CXT GPU高出20%,同时大幅降低了功耗。
然而,IP始终还是走在芯片和应用的前面了,很多人觉得手机上光追就是PPT层面,甚至称其为“有生之年”系列。对于这个质疑,David Harold认为:“主要原因是市面上某些厂商的产品虽然技术成功了,但能耗过大,难以在手机上得到实际应用。这也恰恰体现出Imagination 第4级别的光线追踪对性能和能耗优化的重要性。”
事实上,不同厂商GPU的策略是不太一样的,IMG DXT系列从算力上并不那么突出,与竞争对手ARM以及高通相比,IMG DXT系列的旗舰型号DXT-72-2304算力水平与两者上一代天玑9000的Mali-G710 MC10或者骁龙8 Gen1的Adreno730差不多。但不说算力和性能不能划等号,手机游戏上追光之所以 “难产”,最大的问题还是出在功耗上面。
至于DXT能否让市场满意,还得等待时间验证。据悉,IMG DXT系列预计会在18-24个月内商用。而随着三星、OPPO、vivo、小米等主流下游厂商的硬件光线追踪产品的推出,2023年注定是手机支持光线追踪的关键一年。