过去50余年,芯片制程迭代沿着摩尔定律滚滚向前,并持续增强着芯片的算力与性能。现如今,无论是在SoC上集成越来越多的功能模块,又或是利用chiplet技术在先进制程下进一步提升芯片集成度,都充分展现了芯片性能、功耗和成本的改进不能仅仅依赖于制程的升级,而需从不同的维度拓展创新来延续摩尔定律的“经济效益”。这导致芯片设计变得越来越困难,IP的作用也愈加凸显,逐渐成为企业寻求设计差异化道路上的“秘钥”。
日前,在深圳举办的第10届EEVIA年度中国硬科技媒体论坛暨产业链研创趋势展望研讨会上,Imagination产品市场高级经理黄音在演讲中表示,半导体行业对高性能SoC 需求的增长提振了IP技术市场,作为全球领先的半导体IP供应商,Imagination正紧随市场发展趋势,持续进行技术创新,其核心领域的IP技术演变折射了未来一些热门应用显著的需求变化。
Imagination产品市场高级经理黄音在论坛上介绍Imagination IP技术如何赋能未来硬核科技创新
“倒金字塔”让IP供应商的价值重新被审视
随着服务器市场蓬勃发展,物联网与AIoT应用普及落地,5G+人工智能等技术赋能经济社会数字化转型,黄音表示IP也像蝴蝶一样,从卵、幼虫到蝶变的过程反映了应用市场需求的这种变化,并推动技术不断发展,越来越多的半导体厂商开始考虑借助外力,例如专业的IP公司在某一个领域提供完整的技术服务,从而降低成本并节省产品进入市场的时间。
IP作为经验证可复用的芯片设计模块,从市场价值来看,其全球市场规模约为50亿美元,但却撬动着6000亿美元的半导体产业不断演进,并赋能1.4万亿的电子信息制造业持续发展。黄音补充道:“据lPnest数据统计,在年均600多亿美元的全球芯片研发开支中,IP研发投入只占6%约36亿,但其价值和影响力却远远超出用金钱衡量的份额。IP作为整个半导体上游产业链里的核心,每一元芯片能撑起200多元的社会经济,而每一元IP能支持20000元的社会经济价值。”
数十亿美元的IP行业支撑着数千亿美元的半导体行业
为何小小的IP,却如此重要。芯片巨头公司拥有足够的技术、人才和资金储备,能够面向巨大市场的挑战,而中小型公司及创业公司,在资源的约束下只能专注于某些细分市场。但无论公司的体量是大是小,都面临着激烈的市场竞争,都希望形成技术壁垒和强大的生态系统以更好地生存。而在近乎无限的科技海洋中,没有任何一家公司能精通一切。而IP厂商们能够以某个领域的专业技术能力和经验,提供部分核心技术的成熟产品,协助芯片设计公司和系统厂商,加快技术的产业化周期,提升灵活性和市场反应速度,降低了研发风险、运营成本,加速产品上市和增加利润,帮助企业专注于自身核心竞争力的发展,也是其实现差异化的关键竞争要素之一。
“Imagination技术创新始终聚焦于功能的丰富和面积、性能与功耗优化,并致力于实现最佳的能效比,为客户创造不可复制的核心价值。”黄音进一步说到,“对于IP厂商来说,PPA的三个维度都是重点考量的标准,而Imagination的IP产品通过合理调整三个维度的占比,来完成对不同市场的适应能力,目前已在手机、PC、平板、汽车、桌面服务器、数据中心等领域得到了广泛应用。”
追求最佳PPA,30多年技术积淀赋能独特的GPU IP创新
从市场发展趋势来看,随着数据中心服务器规模不断扩大,灵活性与可扩展性正驱动IP核供应商的技术演变,而功耗、带宽与安全性是芯片设计绕不过的坎儿,针对这些需求如何在技术层面进行创新则是整个行业关注的焦点。黄音在演讲中自信表示Imagination基于在 GPU IP领域三十多年的经验技术积累,以多项独有的专利和核心技术构筑了行业领先的价值壁垒。
灵活可扩展的GPU硬件架构技术
Imagination的GPU硬件架构,有非常好的灵活性和延展性,根据不同的市场和产品需求,单核GPU可以配置为从1PPC、2PPC直到64PPC等不同规格,根据低、中、高不同需求可进行多个不同图像处理能力、浮点运算能力的搭配。如果需要更大规模的配置,还可以进一步提供松耦合的多核架构,甚至是几个多核单元的联合架构,以满足超高性能超大算力的PC、服务器等产品需求。
Imagination的松耦合多核架构技术,能在单个芯片内灵活地切换模式,比如在需要高性能时可以作为单GPU多核协同工作,进行联合渲染和计算;在需要并行的计算多个不同业务时,可以作为多个单核GPU分别独立工作,互不干扰,非常实用。而这个松耦合的技术,甚至可以延展到多颗芯片之间,把一个多核GPU,合理分布到不同的芯片die上,再通过chiplet技术,使它们重新连接起来,能实现与单芯片一样的灵活的模式切换,既能多核联合渲染和计算,又能分别独立工作。在当今瞬息万变的市场环境下,这种技术给芯片设计公司提供了不需要重新流片就拥有的高灵活性和高扩展性,可以应对市场需求灵活转身。
分块延迟渲染技术(TBDR)
在GPU的渲染技术上,与桌面GPU通常使用的立即渲染模式不同,Imagination业内最早提出并采用了分块延迟渲染(Tile-Based Deferred Rendering,TBDR)技术,在顶点着色和光栅化之后加入了延迟环节,充分利用系统内存并通过只渲染可见的像素片段,放弃被覆盖或被遮挡的像素片段来大幅提高整体效率,提供更高渲染性能的同时对带宽和功耗的要求更低。TBDR技术,在带宽有效利用、工作负载高效分配和处理上,有明显的技术优势,这是其独到之处。
Imagination的分块延迟渲染(TBDR)技术
IMGIC压缩技术
为节省带宽,目前业内SoC芯片大多采用硬件压缩技术,据黄音介绍,IMGIC压缩技术可以同时支持像素完全无损压缩和有损压缩,有损压缩支持四种压缩等级,包括压缩率分别为75%(质量接近完美)、50%(视觉无损)、37.5%(一定损失)、25%(最节省带宽)的有损压缩。无损压缩之后,与原图没有差别,还能节省平均50%左右的带宽。有损压缩,则能根据配置的压缩等级,同时将带宽、图片存储尺寸压缩到指定比例,进行有效节省,且在大部分情况下,肉眼很难察觉出压缩后的图片差异。
GPU硬件虚拟化
值得一提是,Imagination还是业界第一家实现GPU硬件虚拟化IP授权的公司,并已广泛应用于众多车型中。黄音解释道在汽车应用中,利用硬件虚拟化技术,OEM厂商可以实现服务与应用程序的完全隔离,以确保在系统被入侵或数据毁损的情况下仍能保持安全。GPU硬件虚拟化解决方案可最多同时支持八个各自独立的容器以运行应用程序或服务,汽车 OEM 厂商能任意部署并移除服务和应用,完全不会影响其他同时运行的容器中的服务和应用。除了隔离,硬件虚拟化技术还支持对多个汽车OS和应用之间,灵活地调整业务优先级和分配GPU性能,节省软硬件成本。
基于固件的GPU
此外在许多架构中,硬件图形事件是由图形驱动程序在CPU上处理的,但Imagination首创的基于固件的GPU能够在内部以超低延迟处理大多数图形事件,这种方法还减少了图形驱动程序的主机CPU开销,并提供了大量有益的额外特性,例如在GPU出错的时候,采集全部的数据日志进行错误分析,通过GPIO连接外部的摄像头或压缩解压缩的设备进行功耗的控制等。
“得益于诸如此类独有的核心技术,Imagination王牌IP核产品PowerVR GPU诞生30年,为3D、2D图形及高性能GPU计算提供了行业领先的高效灵活解决方案。”黄音进一步补充道,“2019年,Imagination的GPU架构有了很大的升级,推出了A系列AXT GPU,作为Imagination的第十代核,相较于第九代性能密度比提高了2.5倍,拥有更完善的运算逻辑单元,提高了纹理处理的能力,能够配置Cache Size,而且优化了压缩算法;2020年,推出B系列BXT GPU产品开始支持多核技术,并且在算力上进行了优化,在微架构上进行了微调;2021年,推出的C系列CXT GPU增加了光线追踪(RAC)的核可以做到硬件光追加速,以满足不同的产品需求。”
从2019年到2022年,Imagination 陆续推出性能强大的GPU IP系列
构建算力新生态,迎接异构计算机遇与挑战
过去的50年是算法和算力发展的50年,计算的创新和演进聚焦于可扩展性、灵活性、效能、效率以及可编程性上。而当数据大爆发带来了AI计算的需求,包括SoC设计公司在内的芯片公司,都在追求更高性能、更低功耗、更节省带宽的方案,异构计算便是必由之路。这需要在硬件和SoC整体设计上采用异构解决方案,把不同类型的核进行集成,如CPU、GPU、NPU、神经网络加速单元等进行叠加,对数据进行专业分工和更先进的处理。
针对异构计算的趋势,据黄音介绍,Imagination将从多个方向进行创新。首先GPU将持续在多核架构上演进、在性能跟功耗上优化。黄音指出:“Imagination的GPU架构支持16和32位浮点运算(FLOAT Operation),以及INT 8/16/32定点运算,而纹理处理单元、反扭曲处理、基础过滤、结合着色器做更加复杂的过滤……这些都能通过GPU里的不同运算器来实现。” 从A系列开始,PowerVR GPU使用了全新的算术逻辑单元(ALU)架构、调度更简单的引擎,可以在相同的芯片面积和功耗预算中使用更多的通道,完全拥抱大规模线程级并行的设计趋势,并简化编译器工作,从而获得更高的利用率和效率。
Imagination针对异构计算在IP架构上的创新技术
Imagination也拥有业界领先的神经网络加速器NNA,采用全硬化的神经网络加速方法学,达到业界领先的PPA。作为异构计算的主力和最高效的部分,NNA拥有着相比CPU和GPU更大的算力和更高的算力密度,承载着大部分的计算任务。
不仅如此,在2021年底 Imagination 宣布推出全新RISC-V CPU核Catapult,作为对GPU和NNA的有效补充,CPU发挥其在控制流和灵活性上的优势,高效地控制和调度好GPU和NNA进行计算,同时也在整体上高效地查漏补缺,是异构计算中不可或缺的一环。
其次,在软件与系统层面,Imagination为异构计算提供了统一、开放并且标准的工具链,支持标准的framework操作,同时为了消除数据瓶颈,对存储、安全进行了创新性优化,使开发者可以快速灵活地把他们的应用部署在异构计算架构上。在整个工具链中,无论是从编译准备还是到设备端实现异构运算,Imagination为开发者提供了丰富的部署和优化功能,包括可以帮助开发者确定量化策略,满足符合其应用性能和精度的要求,并最大程度将灵活性留给开发者。
异构计算具体到应用层面,黄音表示在汽车行业Imagination与芯片厂商、Tier-1厂商合作以及OEM厂商积极展开生态合作,提供IP整体解决方案,重塑与车辆的交互方式。目前Imagination也是汽车行业最大的GPU IP供应商,在驾舱领域拥有约51%的市场份额。
在游戏、VR/AR等应用中,硬件实时光线追踪技术是Imagination最早提出来并实现的。光线追踪可以在不同的性能和效率等级下实现,为了明确这一点,Imagination 建立了光线追踪等级系统(RTLS),确定了从Level 0到Level 5共6个等级的光线追踪功能的要求。IMG CXT采用的Photon架构处于RTLS的4级(Level 4),这是当前可用的最先进的硬件光线追踪技术,应用在移动端可为移动游戏玩家和开发者提供实时硬件光线追踪和桌面级质量的体验。
迈入真正的智能时代,数字化技术成为刚需,这离不开芯片的加持,无论是移动设备、汽车和电器等数字消费应用,还是数据中心、服务器等基础设施行业,都需要越来越多利用先进的IP技术赋能。黄音展望道:“成立30多年来,Imagination一直致力提供高性能IP产品与解决方案,而Imagination在技术上的领先既被市场驱动,也引领市场发展,未来Imagination同样将紧随市场脉络,提高IP核的可扩展性、灵活性和效率,并通过创建强大的异构计算解决方案,在移动、汽车、桌面和数据中心等多元化市场中发掘软件、数据和服务的价值。”