在今年的夏威夷技术峰会上,Qualcomm发布了最新的Snapdragon旗舰SoC,这是去年Snapdragon 888的后续产品Snapdragon 8 Gen 1,将搭载于2022年的机型上。
Snapdragon 8 Gen 1在营销和产品命名方面发生了非常明显的变化,因为Qualcomm正试图简化产品命名和阵容。8 Gen 1仍然是“8系列”的一部分,意味着最高端产品,它重置了之前的三位数命名方案,只显示级别和代际编号。对于Qualcomm的旗舰产品来说直截了当,但7和6系列到底意味着什么还有待观察,这两个系列每代都有若干个产品。
至于Snapdragon 8 Gen 1,新款芯片有许多新的IP:我们可以看到新Armv9架构下的Cortex CPU大中小核,新一代Adreno GPU,大幅改进的成像管道,升级的Hexagon NPU/DSP,集成的X65 5G Modem,所有这些都是在Samsung新的4nm制程上制造的。
CPU
这是高通的第一个采用Armv9架构CPU IP的芯片,其中包括Cortex-X2、Cortex-A710和Cortex-A510大中小核。Qualcomm继续采用1+3+4配置,自Snapdragon 855以来一直是这个配置。
Cortex-X2的频率为3.0GHz,略高于Snapdragon 888上X1的2.84GHz。这实际上有点惊讶,本来人们并没有对这一代的频率报太大希望的。MediaTek最近刚发布的Dimensity 9000在其X2核上实现了3.05GHz,但那是在TSMC N4节点上。
相比之下,Qualcomm在Samsung 4nm节点上生产Snapdragon 8 Gen 1。但Qualcomm的制程是4LPE还是更定制的东西没有表态。
X2最令人惊讶的是,Qualcomm声称性能提高了20%,功耗降低30%,后一个数字特别有趣。Samsung Foundry曾经发表过从5nm到4nm功耗会降低16%,显然30%明显优于制程节点的数据。Qualcomm对功耗降低的原因并没有解释,没有透露任何细节。当被特别问及新的X2是否有自己的电压域(之前的Snapdragon大中核共享相同的电压轨),Qualcomm也没有给出回复。Arm指出,在X1的同一峰值性能点上,X2的功耗可能要低得多,如果Qualcomm的营销材料提到了这样的比较,那么这些数字可能是有意义的。
X2配置了1MB的L2 cache,而三个Cortex-X710各配置了512KB。这里的中核频率略高,为2.5GHz,比上一代略高80MHz。通常,中核更关注功耗预算,所以也许这种轻微的增加确实更准确地代表了制程节点的改进。
最后,新芯片使用了1.8GHz的四个Cortex-A510。与Dimensity 9000不同,Qualcomm确实使用了Armv9架构的新“合并核(merged-core)”方法,这意味着芯片实际上有两个Cortex-A510复合体,每个复合体有两个核,共用一个NEON/SIMD管道和L2 cache。合并核方法旨在实现更好的区域效率。Qualcomm使这种方法合理化,说在线程活动较少、活动总体活动较少的日常用例中,一个核能够访问由两个核共享的更大的L2 cache可以带来更好的性能和效率。但Qualcomm却没有给出L2的大小,无论是512KB还是256KB,如果是后者,那么配置肯定没有Dimensity 9000那么激进。
Armv9 CPU IP还附带了新一代DSU(DynamiQ Shared Unit,集群IP),新的Snapdragon使用该DSU。Qualcomm在这里选择了6MB的L3 cache,这是平衡跨目标工作负载的系统性能的决定。
至于SLC,Qualcomm提到,该芯片继续采用的是4MB cache,内存控制器仍然是3200MHz LPDDR5(4x16bit通道)。需要注意的是,与去年的Snapdragon 888一样,CPU不再能够访问SLC,以改善DRAM延迟。这不得不让人与MediaTek的Dimensity 9000进行比较,后者可能DRAM延迟更差,但也为CPU提供高达14MB的共享缓存,而Snapdragon 8 Gen 1仅提供6MB。这两个芯片之间的比较在实际的量产机型中还有待观察。
GPU在过去,Qualcomm的Adreno GPU架构在家族和性能水平方面都很容易识别。特别是在架构方面,Adreno 600系列始于几年前Snapdragon 845中的Adreno 630,但不同于之前从400和500系列的迭代,直到Snapdragon 888系列,一直保持这种高级别的描述。
Snapdragon 8 Gen 1改变了一切,坦率地说,Qualcomm这次的营销相当糟糕。新的GPU名称完全删除了任何型号,因此不会立即看得出这是更大的微架构转变的一部分,而这种转变过去会作为新的Adreno系列进行营销。
Qualcomm指出,从非常高的角度来看,新的GPU可能看起来与前几代相似,但是有很大的架构变化,旨在提高性能和效率。Qualcomm给出了并发处理优化等示例,这些优化旨在大幅提高现实世界工作负载的性能,这些工作负载可能不会直接显示在测试中。另一个例子是,GPU的“GMEM”在这一代发生了巨大变化,例如cache增加了33%(增加到4MB),是读写缓存,而不仅仅是DRAM流量优化的写回缓存。
峰值性能声称提高了30%,或与Snapdragon 888相同的性能降低了25%的功耗。Qualcomm还一反常态地地评论了峰值功耗的状况和市场的现状。去年,Qualcomm为Snapdragon 888的高峰值GPU功耗进行了合理解释,指出这是厂商方向要求的结果。可以说,这一策略最终给Qualcomm带来了相当大的负面影响。而在这次发布中,我们看到Quaclomm试图与这种情况保持距离,主要是直言不讳地说,这种峰值性能和功耗数字的唯一点是厂商希望实现更高的首轮对标成绩。
不幸的是,与Apple不同,Apple实际上是在相机处理等瞬态计算工作负载中使用了GPU的峰值性能数字,目前Android生态系统只是没有使用任何GPU计算的高级功能。这次承认实际上是对形势的洞察,因为麒麟9000、Snapdragon 888和Exynos 2100以及Tensor Deep-dives等都是如此。这是一个令人难以置信的愚蠢情况,只要媒体继续重视峰值性能数字,都不会很快得到解决,因为芯片供应商将很难拒绝客户以这种方式操作方式的请求。
Qualcomm表示,试图缓解这种对峰值性能的新关注的一个方法是改变GPU性能和功耗曲线的方式。团队表示,他们已经改变了架构,试图拉平曲线,不仅要实现那些可以说是毫无意义的峰值数字,而且实际上还专注于在3-5W功率范围内进行更大的改进,去年的Snapdragon 888没有在Snapdragon 865基础上进行显著改善。
尽管如此,即使相比于Snapdragon 888类似性能的功耗下降了25%,新的Snapdragon 8 Gen 1可能仍然无法与Apple的A14或A15芯片相比。在相同性能水平下,MediaTek的Dimensity 9000也应该在明显优于新的Snapdragon,因此Qualcomm选择的Samsung的4nm节点,似乎相比TSMC的还是存在着竞争差距。
大规模ISP升级
一段时间以来,一直听说2022年旗舰产品将进行大规模的相机升级,MediaTek和Qualcomm正在描述的下一代SoC的新功能解释了原因。
Snapdragon 8 Gen 1的ISP的新名称是Snapdragon Sight,并极大地提高了图像处理链中IP块的能力。
最大的旗舰功能是,与上一代14bit ISP相比,新的ISP现在每个通道的色彩深度为18bit。虽然如今移动图像传感器的ADC仍然只有12bit原生,但新的HDR技术的引入,如交错HDR捕捉,即传感器读数上的曝光紧随其后,这意味着新手机现在能够更快地捕获图像,并将其重新组合成更高的位深结果。特别是在这里,新的18bit ISP管道现在允许从这些新传感器上堆叠三个曝光HDR。
增加的bit深度应该允许在动态范围内增加4站(或2^4=16倍的范围),这非常有助于应对对比鲜明的环境和具有挑战性的照明情况。这远远超出了目前任何其他相机解决方案,能够以这样硬件的方式实现这一点,这在一定程度上模糊了过去几年传统图像捕捉技术和更多软件定义的计算摄影方法之间的界限。
事实上,新的ISP架构似乎是将许多现有计算摄影技术实现到固定功能块中的一种方式:有一个新的神经网络控制的3AA(自动曝光、自动对焦、自动白平衡)和人脸检测块,听起来与谷歌的HDRnet惊人地相似。
据说,通过新的多帧降噪和图像叠加块,夜间模式也得到了极大的改进,现在可以叠加和对齐多达30张图像,并在这一代细节更加精细。Qualcomm在这里声称夜间模式拍摄效果提高了5倍。
进一步的改进包括一个新的失真校正块,现在可以纠正色差,以及一个硬件视频Bokeh引擎,能够以高达4K的视频录制下运行。就像Appled A15上的新电影模式,但不限于1080p。
Qualcomm指出,ISP上的所有AI/ML/神经网络功能实际上都在ISP本身上运行和加速,这意味着它不会转移到Hexagon专用ML处理块或GPU上。
需要注意的是,与Dimensity 9000的9Gpixel/s相比,Qualcomm的3.2Gigapixel/s吞吐量指标在这里似乎很低,两者可能在宣传非常不同的指标,MediaTek宣传的是来自每帧图像传感器的低位深度像素的吞吐量,而Qualcomm引用了ISP内部的全bit深度像素处理。
在视频编码器和解码器方面,新芯片现在允许8K HDR录制,但在其他方面似乎与Snapdragon 888媒体块不相上下。不幸的是,这也意味着还是没有AV1解码。Qualcomm不是Alliance for Open Media的成员,而是支持VVC/H.266和EVC,然而,随着Google和YouTube的积极推动AV1,以及Netflix等大规模采用,Qualcomm仍然不支持2022年机型中的格式值得怀疑。
AI性能
去年的Hexagon IP块对Snapdragon 888来说是一个很大的变化。当时,Qualcomm从独立的DSP/AI架构转向一个更融合的块,能够同时对标量、矢量和张量进行操作。今年的迭代是对这一更大变化的改进。Qualcomm指出,在许多变化中,它们将块的共享内存增加了一倍,为较大的ML模型(正在以非常快的速度增长)提供了更高的性能。
Qualcomm这次没提到到任何TOPS数字,而是表示2倍的张量吞吐量性能,标量和向量处理的增幅较小。通过硬件和软件改进的组合,他们确实认为与Snapdragon 888相比,性能提高了4倍,当然,在平等的软件基础上比较两个平台时,这个数字会更小。
据说,这一代AI工作负载的能效提高了70%,这实际上更重要,应该有助于更苛刻的持续ML工作负载。
X65 Modem集成
在网联方面,Snapdragon 8 Gen 1非常简单,因为它集成了Qualcomm今年早些时候宣布为独立型号的X65 Modem IP。
这里的改进是,它是一个兼容3GPP Release 16的Modem,包括上行波载聚合新功能。其他改进包括3个100MHz的载波上Sub-6带宽为300MHz,并将毫米波带宽从800MHz增加到1000MHz,使得理论上的下行速度达到10Gbps的新峰值。
结论
Qualcomm Snapdragon 8 Gen 1是一个新的开端,无论是从营销角度还是技术角度(尽管细节遮遮掩掩)。作为Snapdragon 888的后续产品,新款芯片CPU采用了新的Armv9架构,同时带来了非常大的GPU改进、大量的新相机功能和许多其他新功能。
Qualcomm简化命名的决定没那么必要。但在从Snapdragon 865过渡到888后,去年的情况实在有点糟,所以这并不完全出乎意料。真正有些不爽的是减少了技术细节的披露,甚至删除了GPU、NPU/DSP或ISP的IP的编号。这种不透明适用于生活方式产品的公司,但不是一个很好的营销策略,也不是一家应该为自己开发的技术感到自豪的技术公司该选择的。无论Qualcomm的营销策略有什么转变,对我们大多数读者来说,重要的是技术层面的东西。
从技术上讲,Snapdragon 8 Gen 1在许多方面都是一个更大的升级。虽然Qualcomm不像MediaTek那么激进,但该芯片在CPU配置方面表现非常强劲,具有高达3GHz的新Cortex-X2大核、2.5GHz的新Cortex-A710中核以及新的A510小核。至少在X2方面,性能指标看起来非常可靠,虽然我们在未来几周内仍然需要更详细地调查能效,但似乎也符合或比预期更好。
在笔者看来,新的Adreno GPU真的没有得到应有的关注,因为真实情况比宣传上展示的要复杂得多。尽管我们仍然不看好Qualcomm能够赶上Apple,或者像MediaTek那样高效,因为人们仍然担心Samsung 4nm工艺节点是否能够缩小与TSMC的差距,但新的架构变化是重大的,与Snapdragon 888相比,我们应该会看到性能和能效方面的重大改进。
最后,这一代最大的变化在相机和ISP系统上。过去几年来,智能手机相机在能力和图像质量方面取得了巨大进步,在这里,技术进步似乎仍在加速(与SoC的其他方面形成对比)。Snapdragon 8 Gen 1的ISP现在具有固定功能块,用于我们过去几年来开创的许多典型的“计算摄影”技术,我认为这将为2022年旗舰机型的厂商实现更大的相机能力。因此,虽然SoC的其余部分可以被视为性能或效率的百分比提高,但新的相机功能预计将真正带来新的创新和体验。
总体而言,Snapdragon 8 Gen 1似乎是Snapdragon 888的可靠后续产品。这对Qualcomm来说是最重要的:开发和交付一款芯片,绝大多数厂商都可以依靠它来实现他们的设备。虽然竞争日趋多元化,也越发激烈,但想要在市场上赶超Qualcomm的执行力也是非常困难的,而8 Gen 1不太可能令人失望。
[参考文章]
Qualcomm Announces Snapdragon 8 Gen 1: Flagship SoC for 2022 Devices — Andrei Frumusanu