加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 为什么重新定义DPU?
    • 第三代DPU芯片K2-Pro发布
    • HADOS 3.0 软件已突破万卡级别落地部署
    • 首次呈现中科驭数DPU全方位云计算实践
    • 国产DPU走向何方?
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

国产DPU加速创新:目标三年破百万量级、市占率30%

06/25 11:18
5311
阅读需 13 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

在第一波云端AI算力的暴涨中,GPU是当仁不让的王者,此外,还有各种针对深度学习等工作负载打造的专用AI芯片也迎来大发展。

不过,通信和计算就好比数据中心的两个臂膀,如果一直提升算力,但是通信基础设施跟不上,整体系统性能还是受限,无法发挥出真正的潜能。这也是为什么,业界越来越多在谈论算网一体化、算网融合等等。

从数据中心长期的迭代方向来看,光网络的铺设、通信的密度、底层算力的生态设施建设等,都在逐渐升级的过程中。带宽不断提升,将有更大的数据量涌入,数据的处理将会越来越复杂,包括网络协议处理、存储压缩、数据加密等,这些本不是CPU和GPU擅长的领域,该由谁来处理?DPU的提出背景就是应对这些数据量和复杂性的指数级增长,作为专注于解决算力基础设施层各种数据流量负载的芯片,它被寄予了数据中心三大支柱芯片之一的定位。

国际上,英伟达、英特尔、AMD微软等厂商都已经在积极布局DPU,国内这个赛道的热度也在不断上升,产品成熟度越来越好。

脱胎于中科院计算所计算机体系结构国家重点实验室的中科驭数,是国内较早进行DPU芯片研发的企业。日前,中科驭数发布了最新一代DPU芯片K2 Pro、软件开发平台HADOS、以及一系列针对数据中心基础设施层业务痛点打造的DPU卡,意在重新定义DPU,解锁更广泛目标场景。

为什么重新定义DPU?

在复杂大型芯片每代产品普遍3~5年的研发周期中,中科驭数用6年时间,完成了三代芯片的迭代,平均每代芯片迭代仅为不到2年的时间。

中科驭数CEO鄢贵海表示,DPU是当下算力基础设施的核心创新之一,就好比数据网络的高铁时代,已经不仅仅是连通城市的问题,而是彻底重构了地理位置的逻辑距离。作为一家创新性企业,中科驭数必须用一年走过别人三年的路,才有可能在市场竞争中赢得生存空间。

如何重新定义DPU,鄢贵海提出了两个主要维度:第一,DPU的定义需要层次化,不应只局限于芯片开发,而是需要在芯片、软件和平台上同时发展;第二,不应该用“DPU帮助卸载CPU工作负载”的狭义视角去看它,而应该是更广。他强调,DPU能够处理GPU和CPU都无法有效处理的任务,如安全业务和分布式安全机制。考虑到分布式和大规模集群系统的需求,DPU也被视为实现算网融合的关键组件。

中科驭数的目标是为算力基础设施提供DPU产品,解决算力资源的弹性扩展、高效互连、加速计算、统一运维等关键问题,打通数据中心算力的——“堰塞湖”。基于此,中科驭数从三个维度重新定义了DPU价值:第一,架构决胜,用先进的芯片架构重新定义DPU芯片架构;第二,软件护城,用最高兼容性来重新定义DPU的软件系统;第三,平台上门,用最低的成本让客户接入DPU规模化部署与业务验证。鄢贵海强调,中科驭数做芯片,最终是为了服务云,以上三方面将构成算力基础设施领域的“芯云计划”。

第三代DPU芯片K2-Pro发布

发布会上,中科驭数第三代DPU芯片K2-Pro正式发布,是目前国内首颗量产全功能DPU算力芯片,专为未来数据中心和云原生环境定制优化。

中科驭数高级副总裁、CTO卢文岩表示,DPU的量产落地是检验其技术创新的“验金石”,整个研发团队的重心也一直是量产和实用。面临底层架构的复杂挑战,中科驭数从基础理论出发,用创新的体系结构理论指导复杂的芯片架构设计,主要基于自研KPU架构以及国内首个DPU指令集——KISA。

作为中科驭数上一代DPU芯片K2的量产版本,K2-Pro在功能、性能、稳定性、灵活性、系统管理、能效性六大维度实现了对K2的升级。在数据处理方面,K2-Pro包处理速率翻倍至80Mpps,在网络密集型应用中能提供更高的吞吐量和更低的延迟;强化复杂业务支持,集成网络卸载、流表卸载、存储卸载及RDMA网络卸载等多类型硬件卸载引擎,实现用轻量控制面支撑复杂业务,复杂服务网格性能从400微秒降至30微秒以内,实现量级跃升;通过PPP、NP内核及P4可编程架构,实现业务与同构算力、异构算力灵活扩展,用户可以根据实际需求动态调整和优化系统配置,相当于让算力得到自由延展;提供全面的片上与板级管理系统,加强资源管理与稳定性;并在DPU复杂场景下能耗降低30%,实现低功耗运行。

基于K2-Pro的架构优势和在功能方面的设计考量,中科驭数推出了三大系列的6款DPU卡产品:分别是面向超低时延网络的“思威”SWIFT系列产品——SWIFT-2200N、SWIFT-NDPP,面向高吞吐无损网络的“福来”FlexFlow系列——FLEXFLOW-2200T、FLEXFLOW-2100R,以及面向软件定义网络的“功夫”Conflux系列——CONFLUX-2200P、CONFLUX-2200E。目前,这六款产品已经上架中科驭数京东官方旗舰店,开启预售。

HADOS 3.0 软件已突破万卡级别落地部署

如果说“性能”的关键是芯片,那么“好用和易用”的核心就是软件。作为衔接硬件和上层应用的桥梁,DPU基础软件是决定硬件是否好用的基础。在本次发布会上,中科驭数正式宣布自研软件开发平台HADOS已全新升级到3.0版本,是中科驭数在DPU基础软件生态建设上的重大突破。

据介绍,HADOS 3.0专为DPU优化设计,核心代码量已经超过 126 万行,累计总代码量近千万行,拥有驱动、计算、存储、网络、安全等不同层次的API 数量高达2765个,并且拥有丰富的、开箱即用的模块和功能。目前,HADOS已突破万卡级别的落地部署,适配了8 款CPU平台以及10大主流操作系统。在行业应用上,已有金融、电信、能源、科研、云数据中心等多个行业在内的数十家用户部署使用HADOS平台,如HADOS的超低时延协议栈结合中科驭数的DPU,已经在国内的证券交易等时延敏感场景批量落地使用。

中科驭数高级副总裁张宇表示,HADOS 3.0是一个里程碑式的版本,不仅是功能和代码的迭代,更是对DPU应用场景深度理解后的全面革新,体现了全面拥抱“敏捷开发”的理念和方法,以及对高效、灵活、安全、易用的极致追求,助力解决 DPU 广泛落地高性能云数据中心。

首次呈现中科驭数DPU全方位云计算实践

云是算力供给的一种最普遍的形式,无论是通用计算、还是智算,因此,支撑云基础设施,也是DPU的核心价值体现。中科驭数联合行业内众多合作伙伴共同打造的以数据网络为核心的高性能云底座方案——驭云,也在本次发布会上正式亮相。

中科驭数应用研发部总经理陈岩介绍,驭云解决方案采用“IaaS on DPU”技术路线,依托于DPU的卸载能力,将云计算体系中的基础设施层面完全下沉,为集群提供网络转发、存储服务、安全防护、管理调度等能力,完成了整个云计算环境的构建与运转,将服务器侧的CPU与GPU算力全部预留给业务系统应用,为云计算提供高性能、高吞吐、高安全的算力底座。

目前,中科驭数在信创园搭建的驭云开放平台,集成了超400台高性能服务器,采用创新的3U一体架构,深度融合CPU、GPU与DPU技术。中科驭数产品运营部副总经理曹辉介绍,驭云开发平台不仅为中科驭数自身的研发与数字化体系提供强大的算力支撑,还广泛向客户及生态伙伴敞开大门,提供DPU软件开发平台、科研教学及验证服务、P4网络编程平台、联合方案孵化服务、基于DPU的高性能异构基础设施资源服务以及DPU云市场六大服务,旨在构筑一个开放、先进的云算力设计与验证平台,加速高性能计算应用的落地与推广。

国产DPU走向何方?

从英伟达最新的产品路线图来看,并未将DPU芯片单独列出,而是将它包含在网络平台产品中进行了布局。虽然不能说弱化了DPU的定位,但对比前些年,英伟达刚刚收购以色列网络芯片商Mellanox时,亲手赋予了DPU“数据中心与CPU、GPU同为三大支柱”的光环,如今,DPU在英伟达的全栈产品布局中确实越来越在退居“幕后”。这对国内独立的第三方DPU企业有什么启发?

对此,鄢贵海首先认为,英伟达目前基本是以完整的高算力节点作为产品形态,注重以集群方式做布局,产品的演进方向与该公司的全局思考密不可分。

他认为,英伟达的技术进步确实给国内芯片企业提供了发展方向,尤其是在算力、精度配置和网络速度方面。在这一背景下,国内DPU企业应该更加专注于核心竞争力,逐步提升技术水平和产业成熟度。同时,鄢贵海也指出国内芯片产业在工艺、设计和产业成熟度上与国际巨头存在差距,还需要时间和专注来弥补,企业发展和行业竞争是一个长期且复杂的过程,需要耐心和持续的努力。

预计今年,K2-Pro将突破10K出货量级。鄢贵海强调,这仅仅是开始,因为目标替代场景太多了,他并不担心未来的市场容量,核心是要把DPU和现有业务集成好,能够把流量无缝导入DPU设备中,迅速让客户能够因为切换而获益,市场自然会越做越全。

“如果非常要给一个数字,我觉得我们的DPU三年内应该可以突破百万量级,在整个网络市场占有率能够达到30%”,鄢贵海信心满满地表示。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
STM32F767ZIT6 1 STMicroelectronics High-performance and DSP with FPU, Arm Cortex-M7 MCU with 2 Mbytes of Flash memory, 216 MHz CPU, Art Accelerator, L1 cache, SDRAM, TFT, JPEG codec, DFSDM

ECAD模型

下载ECAD模型
$25.18 查看
MCF5282CVM66J 1 Freescale Semiconductor IC,MICROCONTROLLER,32-BIT,COLDFIRE CPU,CMOS,BGA,256PIN,PLASTIC
暂无数据 查看
STM32H743IIT6 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下载ECAD模型
$17.38 查看
中科驭数

中科驭数

中科驭数致力于专用处理器研发,为智能计算提供芯片和产品解决方案。围绕DPU芯片打造了智能网卡系列产品和解决方案。

中科驭数致力于专用处理器研发,为智能计算提供芯片和产品解决方案。围绕DPU芯片打造了智能网卡系列产品和解决方案。收起

查看更多

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~