近日,昆仑芯服务器中标招商银行AI芯片资源项目。基于该项目,昆仑芯P800将围绕多个核心业务场景,全面支持招商银行落地大模型应用。
昆仑芯P800基于新一代自研架构XPU-P,显存规格优于同类主流GPU20%-50%,对MoE架构更加友好,且率先支持8bit推理,全面支持MLA、多专家并行等特性。P800单机8卡即可运行DeepSeek-V3/R1满血版,极致成本效率;仅需32台即可支持模型全参训练,高效完成模型持续训练和微调。
目前,昆仑芯P800已与主流通用处理器、操作系统、AI框架完成端到端适配,生态完备、灵活易用。相较行业同类产品,昆仑芯P800不仅性能卓越,且更加易于部署,显著降低大模型运行成本。
深耕AI加速领域十余年,昆仑芯团队积累了行业领先的互联网数据中心系统工程化能力。日前,昆仑芯P800万卡集群在国内率先点亮,并将于近期进一步点亮3万卡集群,为千行百业提供源源不断的稳定、高效算力动能。大模型时代,昆仑芯科技已与智能产业的上下游建立良好的合作生态,通过提供以AI芯片为基础的澎湃算力,在互联网、金融、能源、科研、交通、工业、教育等关系国计民生的众多领域广泛部署应用,加速智能化转型,创造了巨大的产业和社会价值。
昆仑芯科技前身为百度智能芯片及架构部,于2021年4月完成独立融资,原百度芯片首席架构师欧阳剑担任昆仑芯科技CEO,欧阳剑是国内最早从事异构计算与硬件加速项目的工程师之一,主要参与的项目有数据中心AI芯片,ARM服务器和智能网卡等。公司团队深耕AI加速领域十余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的AI芯片企业。
秉承着“让计算更智能”的使命,昆仑芯科技专注打造拥有强大通用性、易用性和高性能的通用AI芯片,目前已实现两代通用AI芯片系列产品的量产及落地应用,在互联网、智慧工业、智慧金融等领域均有规模部署,以AI算力赋能千行百业。
从上图可以看到,昆仑芯已经有2代产品应用及量产,下面就它的产品我们再来了解一下
产品技术
昆仑芯目前有2个系列的产品,分别是昆仑芯1代芯片K系列 和昆仑芯2代芯片R系列。
昆仑芯1代芯片昆仑芯1代芯片采用XPU-K架构,制程为14nm工艺,256 TOPS@INT8,64 TFLOPS@FP16,主要应用于云数据中心和智能边缘,支持全AI算法 。
k200采用昆仑芯1代AI芯片,提供高达256 TOPS@INT8 算力,HBM 16G内存和512 GB/s访存带宽 ,支持计算机视觉、自然语言处理、语音等深度学习及传统机器学习任务,适用于云数据中心或其他高计算密度的训练和推理场景。
昆仑芯 AI加速卡 K100k100采用昆仑芯1代芯片,专为边缘推理打造的AI加速卡,支持128 TOPS@INT8算力,功耗低至75W,体积小巧,适用于各类智能边缘计算场景。
昆仑芯2代芯片第二代云端通用人工智能计算处理器,采用新一代昆仑芯XPU-R架构,通用性和性能显著提升,算力方面:256 TOPS@INT8,128 TFLOPS@FP16,制程采用先进工艺(官网已经删掉具体制程),GDDR6高性能显存,功能完备:支持虚拟化,芯片间互联和视频编解码
R200采用昆仑芯2代AI芯片,256 TOPS@INT8,128 TFLOPS@FP16算力支持视频编解码,支持108路解码和27路编码(H.264/HEVC 1080P@30FPS)全面支持自然语言处理、计算机视觉、语音以及传统机器学习等各类人工智能任务
基于UBB服务器基板卡,支持搭载8个昆仑芯2代OAM模组,支持OCP-OAI标准,提供高达1 Peta FLOPS@FP16算力及200GB/s片间互联,适用于云数据中心的大规模训练和推理场景。
产品比较多,就不详细介绍,总体来说,昆仑芯相对低调。