引言
作为当前技术变革的核心驱动力,AI正全面改变我们生活的方方面面。无论是从科学研究到日常生活,还是从医疗创新到智能交通,AI的潜力正在不断释放。构建高效、创新的AI计算平台需要在硬件创新、软件优化和生态协同等多个维度进行综合整合,以应对不断增加的算力需求和系统复杂性挑战。
在AI技术蓬勃发展的背景下,Arm正在重新定义计算的未来,为全球数十亿用户带来颠覆性的技术与体验。2024年11月,Arm公司在深圳举办了年度技术大会,吸引了全球科技专家和行业领袖参与。在大会上,Arm终端事业部产品管理副总裁James McNiven围绕“构建人工智能计算平台的未来”发表了主题演讲,深入探讨了AI如何推动计算平台的变革,并在会后接受了与非网的采访,分享了Arm如何通过其创新技术等,打造更高效、更具扩展性的AI计算解决方案。
Arm终端事业部产品管理副总裁James McNiven
AI如何赋能千行百业?
James McNiven表示,到2025年底,预计全球将有超过1000亿台具备AI能力的设备基于Arm架构运行。Arm的成功离不开其明确的使命:打造全球领先的计算平台,以卓越的能源效率和性能推动技术进步。自成立以来,Arm通过与生态系统的紧密合作,持续推动移动设备、数据中心、物联网以及AI领域的发展。尤其在智能手机领域,Arm凭借其高能效架构和强大性能,使计算设备从传统桌面走向移动端,为移动计算奠定了基础,并成为行业标准。
AI在汽车行业的应用
AI在汽车行业的核心应用体现在自动驾驶和智能交通系统。自动驾驶技术已从概念验证阶段逐步迈向商业化落地。据市场调研机构预测,到2026年,中国的道路上将有超过100万辆搭载L3级别自动驾驶系统(高级驾驶辅助系统,ADAS)的汽车。L3级别自动驾驶依靠AI技术处理复杂的路况数据,包括行人、交通信号和其他车辆的实时信息,从而实现更加安全和高效的自动驾驶决策。通过识别潜在风险、调整车速以及必要时的自动刹车,这种系统显著提升了驾驶的安全性。
与此同时,智能交通系统也是AI应用的重要方向之一。通过对交通流量的实时监测和数据分析,AI优化了交通信号灯的控制,大幅提高了道路的通行效率。此外,车联网技术的兴起使车辆之间能够实现数据共享,从而进一步推动了交通系统的智能化。例如,AI可以动态调整导航路径,为驾驶者提供更高效的出行方案,并有效减少交通拥堵。这种基于AI的综合解决方案,不仅改善了个人出行体验,也为城市交通治理提供了有力支持。
AI 在智能终端领域的突破
截至2024年底,中国市场将有超过1.7亿台支持AI的智能手机,以及55%的个人电脑具备AI功能。智能手机是AI应用的主要平台之一。从语音助手到影像处理,AI 技术使智能手机变得更加高效和智能。例如,AI算法可以优化照片质量,增强图像识别和语音识别功能,甚至实现实时翻译。随着生成式AI的兴起,智能手机还在逐步成为更强大的生产力工具。用户可以通过手机快速生成文本、图像或其他内容,以满足日益多样化的需求。
AI PC作为PC市场的重大创新,其核心是为用户提供更智能化的功能和更高效的计算能力。通过AI技术赋能,PC已从传统办公工具转型为支持AI推理、自然语言处理和图像优化等先进功能的平台。实时语音翻译、文档生成和推荐算法等新功能正在显著改变用户的日常交互方式。这种智能化的提升,使得AI PC逐渐成为市场新宠,满足了用户对更高性能、更高能效和更个性化设备的需求。
企业级AI应用的创新
在企业级应用领域,AI技术的引入为生成式AI、大语言模型(LLM)和多模态AI等新兴应用提供了强大的底层支持。Arm与AWS等合作伙伴的协作,使其硬件能够高效支持不同的数据类型和操作模式,推动云计算与边缘计算的协同发展。通过提供更高性能和更强扩展性的计算平台,Arm为产业应对新型数据处理需求奠定了坚实基础。
AI 在医疗健康领域的突破
医疗健康是 AI技术应用的另一重要领域,它正在从根本上改变疾病诊断和治疗的方式。例如,DeepMind利用AI成功预测蛋白质结构,荣获诺贝尔化学奖。此项突破不仅加速了药物研发进程,还帮助科学家更深入地理解疾病机制,为精准医疗奠定了基础。
在医学影像分析中,AI也展现出卓越的能力。通过训练深度学习模型,AI 可以快速、准确地检测出X光片或MRI图像中的病变区域,为医生提供辅助诊断。这种能力显著提升了早期疾病筛查的效率与准确性,特别是在癌症等重大疾病的诊断中。此外,AI在手术机器人和远程医疗中的应用,也为医疗行业带来了前所未有的效率和精准性。例如,AI驱动的手术机器人能够辅助外科医生完成高难度操作,而远程医疗技术则打破了地域限制,使更多患者能够获得优质医疗服务。
AI 在边缘计算与物联网中的应用
随着物联网(IoT)的快速发展,AI在边缘计算领域的重要性日益凸显。在边缘设备上进行 AI 推理和决策,不仅能够减少数据传输的延迟,还能保护隐私并降低能耗。例如,AI 驱动的智能安防摄像头可以在本地识别潜在威胁,并作出快速反应,无需依赖云计算。这种本地化处理方式不仅提升了用户体验,还显著降低了系统的运行成本。针对边缘AI应用,Arm提供了覆盖不同性能需求和功耗场景的解决方案,包括Cortex-M、Cortex-A和Ethos NPU。这些产品被广泛应用于物联网、智能家居以及工业自动化场景,为边缘设备提供了高效的AI能力。
在工业物联网中,AI边缘计算设备通过实时监控和预测性维护,减少了生产设备的停机时间,从而提高了生产效率和设备寿命。同时,AI 技术还能够满足从Cortex-M到Cortex-A等多种边缘设备的多样化需求,使其能够适配不同的性能和功耗要求。这种灵活性为AI在物联网领域的广泛应用奠定了坚实的技术基础。
AI 对金融行业的影响
金融行业是 AI 技术应用的重要领域之一,其变革主要体现在算法交易、智能投顾和风险管理等方面。AI 算法能够实时处理和分析海量的市场数据,为投资者提供更精准的决策支持。例如,在高频交易中,AI可通过快速响应市场变化,提升交易效率和准确性。
在风险管理方面,AI利用机器学习模型分析借贷人的信用数据和行为模式,帮助金融机构精准评估风险,从而降低违约率。同时,AI 在反欺诈领域的异常检测能力,也大幅减少了欺诈行为的发生,进一步增强了金融系统的安全性。
AI对教育和生产力工具的推动
AI技术正在推动教育领域的个性化变革和资源优化。例如,智能教育系统能够根据学生的学习特点,动态调整教学内容与方式,从而提供更具针对性的学习体验。此外,AI 驱动的在线教育平台和虚拟课堂,也帮助学生更加高效地掌握知识,同时减轻了教师的工作负担。
在生产力工具方面,AI 应用的范围也在不断扩大。智能客服系统通过自然语言处理技术快速响应用户需求,提高了企业服务效率。而自动化办公软件在数据分析、报告生成和项目管理等方面的广泛应用,大幅提升了办公效率。
在生成式AI领域,Arm通过将 KleidiAI 直接集成到主流的框架中,优化大模型性能。例如,通过集成KleidiAI,腾讯的混元大模型的操作效率显著提升,降低了计算资源的消耗并缩短了开发周期。
Arm如何通过芯片技术助力AI创新?
随着人工智能(AI)技术从云端向边缘侧的发展,智能手机再次成为其重要载体。Arm的技术创新,例如可伸缩向量扩展(SVE2)和可伸缩矩阵扩展(SME),赋予智能手机实时图像优化、语音识别和生成式AI能力,为用户带来焕然一新的智能体验。通过性能提升与能效优化,Arm进一步推动了智能手机在AI领域的广泛应用。
基于Armv9.2架构的Cortex-X925 CPU在性能与能效方面实现了全新突破。在Geekbench 6.2测试中,该CPU以15%的每时钟周期指令数(IPC)提升,创下了单线程性能新高。作为CPU性能的关键指标,IPC反映了设备处理复杂计算任务的能力。简单而言,IPC的提升意味着智能设备能够更高效地完成任务,从而带来更流畅的用户体验。在AI性能方面,Cortex-X925实现了41%的性能提升,为设备端生成式AI如大语言模型(LLM)的响应能力提供了强大支持。这一创新显著加快了AI应用的响应速度,使用户在使用聊天机器人、图像处理及多模态交互时能获得更直观、更流畅的体验。
“我们推出了Arm终端计算子系统(CSS),为客户提供优化的解决方案、强大的软件生态系统,以及更快的上市时间。” James McNiven对与非网记者表示。Cortex-X925通过升级私有L2缓存至3MB,并优化矢量管线,使其能够更快速预取数据和处理复杂指令。同时,利用三纳米工艺的优势,该CPU在游戏等持续高负载应用中表现尤为出色。在实际使用中,用户不仅能感受到更快的应用启动速度和网页加载速度,还能在游戏中体验更高画质和更流畅的操作。此外,得益于能效优化,智能设备的续航能力进一步提升。
在图形性能方面,与上一代产品相比,全新Immortalis-G925 GPU性能提升37%,AI和机器学习(ML)网络性能提升34%。这一GPU针对旗舰设备市场设计,而包括Mali-G725和Mali-G625 GPU在内的系列产品则面向智能手表、可穿戴设备等广泛的消费电子设备市场。
在硬件设计方面,最新的Armv9架构通过SVE2和SME指令集提升了AI计算性能,同时确保设备在不同场景下的高效运转。与晶圆代工厂的合作使得Arm在先进制造工艺上持续保持领先地位。通过优化设计流程,Arm实现了性能和能效之间的最佳平衡。特别是在边缘AI设备中,其低功耗设计有效支持高效推理,使设备能够以更低的能耗完成复杂计算任务。
除终端CSS外,目前,Arm已推出Neoverse CSS面向数据中心等基础设施应用,并且将于2025年推出汽车 CSS。根据市场预测,到2026年底,中国将有超过100万辆搭载L3级别ADAS功能的汽车投入使用,而CSS技术无疑将为这一目标的实现提供重要保障。
随着人工智能(AI)技术的迅猛发展,计算需求的复杂性和多样性不断提高,传统单片芯片设计模式逐渐显现出其局限性,难以满足现代AI计算平台对高性能、灵活性以及成本效益的多重要求。在这样的背景下,芯粒(Chiplet)技术作为一项突破性创新,正受到业界广泛关注。通过模块化设计理念,芯粒技术为AI计算提供了性能与扩展性的大幅提升,同时优化了硬件开发流程与多样化应用场景的适配能力。
芯粒技术的独特优势
芯粒技术是一种模块化的芯片设计模式,将传统单片芯片分解为多个独立的物理单元(芯粒),再利用先进封装技术集成为一个整体。这种模式相比传统设计带来了多重优势:
降低开发难度与成本:开发者可根据具体需求,选择不同工艺节点的芯粒组合,从而减少芯片设计和制造的技术门槛和成本。
缩短开发周期:模块化设计显著提升了产品迭代速度,使硬件开发者能够更快地响应市场需求。
适配多样化工作负载:芯粒技术能够灵活满足AI计算在推理、训练以及数据分析等多场景下的要求,从数据中心到边缘设备均能发挥其价值。
例如,在数据中心,芯粒架构通过优化计算资源分配,提升性能效率和能耗比;在边缘计算领域,芯粒技术支持小型化设计,降低功耗,确保设备在受限环境中高效运行。
高性能与灵活性的兼顾
芯粒架构的核心价值在于实现性能和灵活性的高度平衡。开发者可以根据AI计算的不同需求,自由组合芯粒以满足特定目标。例如,在处理复杂的AI工作负载时,可将CPU、GPU与专用加速器(如NPU)芯粒组合,实现优化计算性能的同时控制成本。此外,芯粒架构还具备出色的扩展性,允许开发者在无需重新设计整个芯片的前提下,替换或添加特定芯粒,从而快速适应新兴市场需求。
Arm终端事业部产品管理副总裁James McNiven指出:“芯粒是一种非常有前景的技术,可以根据需求灵活组合,就像搭建乐高一样搭建物理芯片的IP模块。” 这一观点形象地阐释了芯粒技术的灵活性和模块化设计理念,同时为AI计算平台的未来发展指明了方向。
作为全球领先的计算平台公司,Arm在芯粒技术领域进行了深远布局,通过与行业领导者的合作,加速了芯粒技术的标准化与生态系统建设。Arm目前联合全球约50家企业共同制定了芯粒系统架构(Chiplet System Architecture, CSA)标准,为芯粒设计和封装提供了统一框架。这种标准化的推动,既降低了开发难度,也促进了行业内的协同创新。
在芯粒技术的发展中,Arm通过与行业领导者的深度合作,推动其在实际应用中的落地。例如:
云端AI计算:与AWS合作开发高效的芯粒架构,优化云计算平台的AI性能。
高性能模型优化:在与Meta的合作中,Arm结合CSS平台和芯粒架构,对Llama 3模型进行优化,使其运行速度提升2.5倍,首次响应时间显著缩短。
这些合作不仅展示了芯粒技术在高性能计算中的潜力,还为未来AI计算平台的优化积累了宝贵经验。
Arm如何助力AI生态系统成熟?
AI技术的快速推进不仅需要技术创新,更依赖产业链的深度协作。除了通过技术助力AI创新,Arm还通过全面的软硬件整合和协作助力AI生态建设。
硬件:异构计算与芯粒架构
Arm的终端计算子系统(CSS)是其生态创新的核心。CSS通过将CPU、GPU和NPU等计算单元深度整合,优化了多样化AI工作负载的分配,实现了高性能与低功耗的平衡。例如,通过系统级的整体设计和异构计算策略,CSS不仅提升了设备能效,还缩短了产品开发周期,为合作伙伴快速进入市场提供支持。
此外,Arm积极推动芯粒架构CSA的普及。这种模块化设计允许开发者根据需求自由组合硬件模块,降低了芯片开发成本。芯粒架构就像“乐高”一样灵活,使得中小型企业也能快速进入AI市场并推出创新产品。这种技术创新大幅降低了AI硬件开发的门槛,为更多企业参与生态建设创造了条件。
软件:KleidiAI的加速作用
硬件的进步必须通过软件释放其潜力。为此,Arm推出了KleidiAI软件库,为开发者提供了即插即用的优化工具。KleidiAI通过抽象硬件复杂性,确保主流AI框架(如PyTorch、TensorFlow、MediaPipe)能够在Arm平台上无缝运行。通过深度整合这些框架,KleidiAI帮助开发者快速优化AI应用,从而加速其部署和性能提升。
例如,在与腾讯的合作中,通过集成KleidiAI,混元大模型的预填充速度提升了100%,解码速度提高了10%,显著优化了开发效率和用户体验。同样,与Meta合作优化的Llama 3模型,KleidiAI在不到24小时内完成集成,使模型运行速度提升了2.5倍,首次响应时间大幅减少。通过这些实际案例,KleidiAI展现了其在推动AI技术性能提升和应用落地方面的关键作用。
Arm Total Design生态项目:整合产业链资源
Arm Total Design生态项目通过整合硬件制造商、软件开发者、晶圆代工厂和研究机构,构建了一个开放协作的生态网络。该计划通过资源共享和技术协同,帮助合作伙伴高效完成产品设计和优化。例如,在硬件层面,Arm与晶圆代工厂合作推进芯片生产技术,支持最新的3纳米工艺;在软件层面,通过开源工具和技术支持降低开发者的技术门槛。
生态建设推动终端快速发展
当前 AI PC 的快速发展已成为智能终端领域的一大热点,而Windows on Arm平台在AI PC的发展中起到了关键作用。Arm通过与微软等合作伙伴的深度协作,优化了基于Arm架构的Windows 11系统,为开发者提供了高效的硬件架构支持和广泛的原生应用开发能力。这些努力有效解决了生态兼容性问题。例如,爱奇艺、哔哩哔哩和搜狗输入法等大量原生应用已成功在该平台上运行,充分利用了AI PC的算力优势,为用户提供了流畅的体验。据微软统计,Windows 用户平均90%的时间集中在原生应用的使用上,反映了Windows on Arm生态系统的快速成熟。随着更多硬件设备、开发工具和原生应用的推出,AI PC的生态将更加完善,为消费者和开发者带来更大的价值。
James McNiven 表示:“从Arm的角度来看,我们需要思考如何打造一个软件库,通过将其集成到合作伙伴的软件中,让这些应用能够在包括移动终端在内的端侧领域,充分发挥 Arm CPU 的性能优势。”这种战略不仅降低了开发者的技术门槛,也加速了AI在智能终端中的普及。此外,智能家居设备同样受益于AI的进步。AI驱动的控制系统可以根据用户习惯自动调整温度、光线和音响效果,为用户创造更舒适便捷的生活体验。
在推动AI智能手机市场发展方面,Arm通过与终端厂商的合作进一步优化技术应用。例如,Arm与vivo成立联合实验室,通过基于真实使用场景的研究,将硬件性能优化与用户需求紧密结合。vivo在市场洞察和用户体验上的深厚积累,使得这次合作成果显著。正如James McNiven所说:“通过OEM厂商深入理解用户需求,我们能够更好地优化产品,带来更优异的移动体验。”这种合作模式不仅加速了产品创新,还为行业提供了生态协作的范例。
构建全球最大的开发者社区
开发者是AI生态系统的核心资源。Arm通过多年的生态建设,吸引了超过2000万名开发者,形成了全球最大的计算生态社区。通过提供统一的技术栈和友好的开发环境,Arm帮助开发者快速实现创意落地。例如,与龙蜥社区、欧拉社区等开源社区的合作,为AI开发者提供了高效的工具链,显著降低了开发门槛。
这种开放协作模式使得AI应用开发变得更加便捷。例如,在新的硬件架构发布后,开发者无需对代码进行大规模调整,即可通过KleidiAI技术实现性能优化。这种开箱即用的特性不仅提高了开发效率,还帮助开发者快速响应市场需求。
Arm还通过跨行业合作,推动AI技术的多样化应用。例如,与Unity合作开发的端侧AI推理引擎Sentis,不仅降低了模型内存占用,还提升了游戏开发的性能;与OpenCV的合作则显著加速了计算机视觉任务,为图像处理提供了高效支持,具体来说,基于 KleidiCV 集成,OpenCV 发现各种图像处理任务的典型性能提升高达 75%。这些合作案例表明,Arm不仅致力于技术创新,还积极推动生态系统内的资源整合和协作。
总结
AI不仅是一项技术变革,更是推动社会转型的重要动力。面对不断增长的AI计算需求,无论是在边缘设备、消费终端还是数据中心,Arm正在通过持续的架构创新和技术优化,为行业提供高效解决方案。
作为全球计算平台的引领者,Arm致力于与开发者、企业及行业伙伴携手推动统一技术栈和开放生态建设,降低AI技术应用门槛,让更多企业与开发者融入AI创新浪潮。通过开放、协作与创新,AI的潜力将被充分释放,为社会创造深远的价值与变革,为构建更加智能、互联、高效的未来世界贡献力量。