近日,中科驭数重磅发布第三代DPU芯片K2-Pro,是国内首颗面向量产的全功能芯片!
K2-Pro采用自主研发的Kernel Processing Unit架构,集网络、存储、安全及计算等多业务卸载功能于一体,包处理速率翻倍至80Mpps,最高支持200G网络带宽,具备高度可编程性,确保了系统的灵活扩展性,为数据中心的业务增长和算力扩容提供坚实基础。在处理复杂任务时,K2-Pro相比上一代芯片能耗降低30%。
作为一款纯国产的高性能解决方案, K2-Pro以其全面性能的均衡与卓越,成为数据中心战场上的“六边形战士”,可广泛适用于云计算、智能计算、及高性能计算等领域,也为数据中心的算力升级提供了全新解题思路。同时,K2-Pro也必将成为推动DPU芯片进入大规模量产的标杆之作。
自研KPU架构和KISA指令集
用创新的体系结构理论指导复杂的芯片架构设计
对于中科驭数来说,DPU的研发之路上,架构创新不是可选项,而是必选项。中科驭数在芯片研发领域持续深耕,从底层架构入手,致力于解决DPU芯片面临的高带宽、低延迟及复杂业务需求挑战的决心。
KPU架构——专用计算代表性架构
自主研发KPU芯片架构是中科驭数多年体系结构研究的结晶,基于软件定义硬件的技术路线,创新性地提出了面向专用计算统一计算架构KPU。该架构采用异构计算核作为基本单位,根据上层应用的具体需求定制化设计,具有软件可定义、超高并行处理能力、超强处理性能三大优势,配合数据流驱动的运算激活机制,确保了系统灵活性与高效运行的完美平衡,为DPU芯片设计打造新标杆。
KISA指令集——业界首个DPU指令集架构
以此为基础,中科驭数进一步推出了首个专为DPU设计的指令集架构——KISA,旨在解决专用计算领域编程范式的碎片化问题。不同于传统的CPU指令集,KISA紧密贴合DPU的特性,强调数据处理而非控制流,高计算密度型而非低计算密度型,采用数据流而非字节作为基本操作单元。更重要的是,KISA首次在指令集层次支持敏捷异构,用一套统一的指令实现了多种异构处理核进行管理调度。
目前,KISA指令集涵盖了KISA基础架构、以及面向DPU专用处理扩展指令,包含包解析、转发指令、以及表查询指令等。基于KISA已经覆盖25大类应用场景,累计数百个用例,得到非常充分验证。
KISA指令集的推出,将软件定义技术路线向着更加可落地、可执行的方向推进了一大步,系统性地解决了领域专用计算的编程范式混杂的难题,让开发变得更加简单高效,让每一行代码直达DPU算力。
实用制胜,量产为王
K2-Pro何以称为数据中心的“六边形战士”?
基于以上两大底层技术创新,不仅打破了传统DPU设计,更推动了DPU芯片向更高性能、更强灵活性和更低功耗方向发展。相较于单一性能的极致追求,中科驭数在DPU设计上秉持全面卓越的理念,致力于打造“全能冠军”而非“单项冠军”。
因此,K2-Pro在立项之初就把“实用制胜,量产为王”作为研发目标,确保技术创新与市场需求紧密结合。历经深度优化以及融合了对数据中心未来中心场景的深入理解,K2-Pro最终实现以下六个方面的极致优化:
K2-Pro是先进、好用的网络芯片
对于DPU来说,首先是一个网卡,才能再谈进一步拓展其复杂业务的处理能力。为此,中科驭数团队在基础网络功能上苦下工夫,将K2-Pro打造成综合能力强悍的网卡芯片。
一方面,在实现基础网络卸载功能上,K2-Pro集成了高通量DMA以及硬件虚拟化技术,并通过丰富的软件显著增强了运维能力,这一进步在国产网卡领域中尤为突出,直接对标国外主流产品。
另一方面,K2-Pro着重在网络延时、高阶包处理能力上做了增强。通过优化设计,K2-Pro将端到端网络延迟控制在1.2微秒以下,处理带宽达到200Gbps,做到业界领先水平,成功填补了国内低延迟网卡市场的空白。
同时,结合其可编程的包处理引擎,K2-Pro打破了传统网络处理局限于二层包的框架,赋予用户更高的灵活性去执行包解析和深度数据分析任务,根据自身需求设计特定的安全策略、流量优化方案等等,让用户在硬件层面实现个性化配置,极大提升了数据中心网络的智能化和定制化程度。
K2-Pro是高通量数据处理芯片
K2-Pro芯片,作为一款面向数据中心的高性能数据处理核心,其优势在于如何高效且有序地管理复杂多变的基础设施层服务。
DPU业务里面有非常鲜明的特点:一是业务类型繁多且性质各异,涵盖网络、存储及各类用户特定应用,每种业务不仅要求精确解析,还需定制化处理逻辑,加之不同业务的处理时延各异,极易引发处理顺序混乱等难题。二是并发级别极高,应对千万级别的数据流、管理动辄数百上千的虚拟机,是数据中心面临的运营常态。三是对延迟高度敏感,与GPU的批处理加速模式不同,DPU要求在严格的时间窗口内完成任务,任何延误都将导致数据丢失。
鉴于此,K2-Pro的高通量数据处理能力成为其核心竞争力,其背后的关键技术在于精细的流调度与隔离机制。经过深入研究与优化,K2-Pro从流的精准识别到并发处理能力均实现了显著提升,确保在极端并发场景下仍能维持高水平性能,几乎不受流量洪峰影响。最终做到了在承载千万级并发流、服务上千租户、处理千万级流表及数十种不同租户配置的复杂业务之下,稳定输出200Gbps数据吞吐率及40Mpps包处理能力的领先性能,让数据处理更加“游刃有余”。
K2-Pro是强业务卸载芯片
在复杂的云服务环境中,尤其是面对如服务网格这类高控制复杂度的业务,现有DPU技术往往难以有效承担,其业务卸载效率低下,通常不足20%。业界普遍采取的应对策略是增强控制层面的资源配置,极端时甚至采用服务器级CPU来维系控制功能。但这不仅未能从根本上改善服务质量和降低延迟问题,反而可能导致资源浪费。
基于上述挑战,中科驭数团队一直认为DPU必须轻控制,而非盲目追求与CPU相匹敌的控制能力。在此理念指导下,K2-Pro在设计上实现了多项关键技术突破,包括但不限于精密的流调度技术、高效数据交互协议,以及专门设计的网络卸载、表项卸载、存储卸载、RDMA卸载等重要引擎,将原本在DPU上难以卸载的业务比例从低于20%显著提升至90%以上,大幅减轻了控制面的压力。
服务治理场景下,K2-Pro也实现了量级的跃迁,将原先400us以上的治理延时降到了30us以内,显著优于当前市场上的解决方案,为确保高性能、低延迟的云服务环境提供了强大的技术支持。
K2-Pro是灵活可扩展处理芯片
虽然DPU出现时间不长,但是它的潜力在加速显现。随着更多业务向DPU转移,以及协议迭代和任务类型的增加,DPU的扩展能力成为关键。因此,K2-Pro芯片在三个维度上实现了独特性的可扩展性设计,让业务与同构算力、异构算力灵活扩展:
可编程与卸载能力:K2-Pro自身不仅配备了高性能的可编程引擎,还融入了协议分析引擎(PPP)与通用算法引擎(CAE),确保了对不断演进的协议和复杂算法的有效支持。中科驭数在金融领域做过一个尝试,通过全面卸载特定的金融通信协议和业务算法至DPU,性能相比现有方案提升了十倍以上,刷新了行业认知。
芯片级联与算力自由扩展:为满足日益增长的算力需求,中科驭数创新设计了DPU间的高速互联技术,支持芯片级联,使多个DPU能够无缝串联,实现DPU算力自由扩展。这一方案与行业标准接轨,为大规模数据中心的算力部署提供了高效路径。举例而言,通过多芯互联,能够轻松部署高性能的NAT网关解决方案,为数据中心的网络架构升级和业务扩展打开了新的可能性。
开放的外接算力集成策略:K2-Pro还致力于与其他类型算力芯片的协同工作,提供了多元化的集成方案,既展现了DPU在构建综合性解决方案中的灵活性,也预示着未来将有更多跨领域的创新合作案例涌现,进一步拓宽DPU的应用边界。如中科驭数在与安全芯片厂商的合作中,共同打造了处理能力达到百Gbps级别的安全解决方案。
K2-Pro是稳如磐石的“管理”芯片
DPU在一般认知中常被视作辅助或“副手”角色,负责任务卸载,然而实际上,它在数据中心扮演着更为关键的主角身份。DPU不仅参与虚机的生命周期管理、资源调配等核心任务,还必须保证全天候稳定运行,是数据中心最中心的处理核心。
中科驭数对稳定性给予了高度重视,对K2-Pro进行了深度优化:纳秒至毫秒级的分级异常恢复机制确保快速响应;系统与核心间的异常隔离设计,即使内部模拟攻防,也能维持运行不中断。配备的实时状态监测系统,对芯片内每个数据包、每个子系统的状态进行不间断监测,及时发现并预警潜在问题,实现了芯片内每个环节的全天候精准监控。截至目前,这种级别的监测精细度和系统稳定性在同类DPU产品中尚属罕见。
K2-Pro是极致能效比的网络芯片
能耗考验也是DPU在设计时面临着的又一大难题。尽管DPU承担的任务远超传统网卡,但在服务器架构中,其安装位置和功耗预算仍旧受限,类似于网卡的配置要求。鉴于此,中科驭数团队深知,要想实现DPU的广泛应用,必须在能效比上取得突破。
中科驭数不仅采用了诸多成熟的低功耗技术,更从应用层面进行了深度优化,通过精细的电源管理策略,实现了在不影响性能的前提下,对芯片面积和运行频率的精准调控,这一过程虽充满挑战,近乎苛刻,却也体现了团队对技术极限的不懈追求。最终,DPU在多种应用场景下展现出了显著的能效优势,相比上一代功耗降低30%,与国际DPU产品相比也有更为出色的能效表现,为DPU的大规模部署奠定了坚实的能效基础。
中科驭数高级副总裁、CTO卢文岩博士表示,正是我们坚持自主研发,突破技术壁垒,我们才能开发出自主知识产权的KPU架构与KISA指令集,为DPU领域贡献了我们的创新成果;正是这份对六个关键领域“死磕到底”的决心,我们才能在造“芯”路上厚积薄发,见证这个数据中心“六边形战士”的诞生;也正是我们坚持技术与市场的紧密结合,将量产与应用视为同等重要,我们才能见证K2-Pro成为了一款真正可落地、可推广的高性能DPU芯片。相信K2-Pro的问世,将会是数据中心算力技术革新的重要里程碑。期待见到它走向各行各业,未来在数据中心乘风扬帆,在算力征途上破浪前行!