从广义 GPU 赛道来看,英特尔凭借庞大的 CPU 出货,联合其核心显卡,在这一领域占据了半数以上的可观份额。不过,随着图形算力和AI 算力的需求逐渐增加,核心显卡受制于核心规模、显存带宽等因素难以突破性能上限,特别是在高性能计算等场景更显不足。
近年来,有关英特尔在规划独立GPU的消息不绝于耳。终于在今年靴子落地,英特尔发布了锐炫A系列移动端独立显卡,代号为Alchemist的独立显卡今年第一季度初开始出货。此外,英特尔还开始销售用于消费市场的游戏显卡,以及面向数据中心的专业显卡和加速卡产品。这意味着,独立GPU赛道正式迎来一位资深玩家的回归,也由此开启了一场更为激烈的竞争,对于算力的多元化、异构等方面意义重大。
“像素爆炸”时代的驱动力
日前,英特尔举办了以“应云而变,携手加速创新”为主题的英特尔数据中心 GPU Flex系列媒体沟通会。活动上,英特尔分享了数据中心 GPU Flex 系列在应对算力挑战、满足新兴智能视觉云负载所需的多项软硬件创新及突出的灵活性和可扩展性,并携手中科大洋、亿联网络、火山引擎、当虹科技,针对媒体处理与传输、AI视觉推理、云游戏工作负载解析了Flex系列GPU的部署成果。
英特尔市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉,用“像素爆炸”来概括了当下的变革。
根据Altman Solon关于 2021年全球像素和用途数据显示,全球累积产生的用户原创内容达每秒19 万亿个像素,全球视频内容消费则达每秒 7 千亿个像素。她指出,“我们正处于一场由更多用户、更多应用和更高分辨率所共同驱动的“像素爆炸”变革中。置身其中,海量用户、海量应用以及超高分辨率要求当今的数据中心基础设施承担着计算、编码、解码、传输、存储和显示视觉信息的巨大压力,传统模式中单一且孤立的计算架构不足以应对。”
为了打造更为多元化、足够差异化的异构计算平台,英特尔基于XPU战略打造了跨CPU、GPU、FPGA、IPU等多种架构的算力资源。今年8月,面向云计算的数据中心 GPU Flex 系列也正式推出,英特尔希望基于Xe-HPG 微架构,Flex 系列 GPU能够更好的满足图像质量、部署密度和时延方面的要求。
英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰表示:“由像素爆炸带来的大量图形视频类数据,亟需功能强大的数据中心GPU来进行处理。基于全方位的硬件和软件创新,英特尔数据中心GPU Flex系列可以灵活处理媒体处理与传输、云游戏、AI推理、VDI多种云工作负载,有效优化使用者的总体拥有成本。我们很高兴地看到英特尔和合作伙伴一起推出了超过15款基于Flex 系列 GPU的系统设计,助力终端用户实现业务数智化部署。”
据了解,英特尔数据中心GPU Flex系列包含4个Xe 媒体引擎、 XMX AI 加速单元和 AV1 硬件编解码器,也是英特尔在数据中心领域首款支持AV1编解码的独立GPU。
该系列GPU单卡能够支持多达36路视频流的1080p60转码吞吐量,以及 8 路视频流的 4K60 转码吞吐量,能够以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。此外,英特尔数据中心 GPU Flex系列基于硬件的开源 AV1 编码器可节省30%以上的带宽。 Flex 140 GPU 的媒体引擎还支持包括 HEVC、 AVC 和 VP9 在内的业界广泛使用的编解码器,并可以有效提高其性能。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。
热门应用并行推进
在应用层面,视频行业快速进入 4K/8K 时代,在为用户带来更出色的视频观看体验的同时,也对视频解码和转码系统的性能,以及总体拥有成本带来了严峻的挑战。中科大洋利用英特尔数据中心 GPU Flex 140,并使用涵盖英特尔oneVPL在内的英特尔oneAPI 工具套件进行优化,其LeoVideo Cloud在多媒体转码和视觉图形处理等方面能够实现解码16路4K并发或4路8K并发或 60路高清并发,以及编码6路4K并发或30路高清并发,这一性能表现远超传统产品,而且具有更优异的性价比。
中科大洋技术研究院院长褚震宇表示:“英特尔数据中心显卡拥有雄厚的技术实力,并一直保持快速革新。基于我们的测试,英特尔数据中心GPU Flex 140在相近的码率和编码参数下,该 GPU 的编码效率与编码质量更优。未来,中科大洋与英特尔将持续深化在视频云编、转码应用场景以及计算机视觉AI推理方面的合作,共同推动产业化发展,助力广电行业 ‘5G+4K/8K+AI’ 的战略格局。”
另一方面,数字化办公的推进也极大促进了视频会议的应用普及与发展。视频会议厂商都在不断升级优化音视频技术,以满足不断升级的市场需求。
为了打造全新数字化办公空间,追求行业前沿音视频技术,亿联网络运用Flex系列GPU的能力,全面升级了视频会议系统中的音视频性能,为用户带来如临其境的全能智会体验。亿联网络高级解决方案架构师林振鹏谈到,“利用Flex系列GPU的能力,能够更好支持4K超清视频的编解码,给用户带来更好的会议体验,同时GPU能够更好支持H.265等新兴的编解码技术,从质量、性能、带宽等多角度全面升级亿联视频会议的服务能力。在功能应用上,Flex系列GPU是业内少数几家能够完整支持解码、混屏、缩放、编码应用的GPU,更完整支持我们的视频编解码业务要求。”
云游戏也是当下的热门应用之一,正呈现出快速增长的趋势,同时,也亟需更灵活的解决方案来为用户提供更多的实时游戏流。Flex 系列 GPU 为提供更优的游戏服务质量而打造,可在各种设备上带来畅爽的游戏体验。
在火山引擎技术支持的3D动作手游《航海王热血航线》中,Flex系列GPU以强大的图形渲染能力和多媒体编解码能力带来了流畅度、画质等方面提升。火山引擎系统架构师梁宇提到,“单个Flex系列140 GPU可支持渲染20路720p60数据流,编码60路720p60数据流。Flex系列GPU提供了更多路实时云游戏流,保证了更优的游戏服务质量。” 值得一提的是,Flex系列GPU的应用也可以显著降低总体拥有成本,能够以更多游戏路数和更少的基础架构为用户带来畅爽的云游戏体验。
AI推理在众多应用中都展示了该有的“魔力”。随着新媒体的高速发展,各种显示设备的分辨率不断提高,人们对于影片清晰度的要求也越来越高。以AI画质增强技术为代表的技术革新,也让视频超分、插帧等算法在老片修复及4K生成等场景中得到广泛应用。
基于此,当虹科技与英特尔开展合作,升级了一套用于老胶片电影修复、重要历史资料纪录片翻新和大数据人文素材修复等场景的解决方案。当虹科技解决方案总监郑晓玲表示,“以第三代英特尔至强可扩展处理器和英特尔数据中心GPU Flex系列170为硬件基础,以英特尔oneAPI工具套件和英特尔分发版OpenVINO工具套件为软件基础进行编程和优化,使AI老片修复更加多样化、高效化和智能化。”
生态增长势头良好
结合硬件方面的独特优势以及对于开放软件生态系统的投入,仅仅上市数月,英特尔数据中心GPU Flex系列在国内已通过搭载新华三、浪潮、宁畅、宝德、超聚变4等众多OEM合作伙伴的系统陆续面市,同时在当虹科技、中科大洋、火山引擎、亿联网络等行业合作伙伴的实际使用场景中实现了针对不同视觉云工作负载的应用部署落地,在此过程中也获得了来自中国联通、天翼云、移动云的电信运营商的支持,整体生态呈现良好增长势头。
庄秉翰表示,行业期待在GPU方面有更多的不同选择,因为有竞争才会有进步,因此英特尔的GPU新品一推出就受到了很高的关注度,且用户期待都比较高。此外,英特尔的强项之一就是对产业链生态伙伴的支持,目前,Flex系列GPU的生态伙伴包括服务器厂商、ISV厂商、运营商、系统集成商和OEM等。一个好产品的推广,离不开生态伙伴的共同努力,英特尔将继续全方位赋能数据中心生态伙伴,强化合作伙伴的解决方案能力,并携手强大生态加速产业创新。