加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

5T算力BPU x 14亿参数LLM,地平线旭日3成功部署大语言模型

2023/09/12
2715
阅读需 4 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

近日,地平线成功在旭日3中的BPU®️计算单元上,部署运行参数规模高达14亿的大语言模型(Large Language Model , LLM)。这不仅是业界在端侧成功部署大模型的一次突破性实践,更验证了BPU®️对先进神经网络算法的高效支持,为大模型在端侧实现产品级应用拓展了更广阔的想象空间。

大模型端侧部署的技术实践对加速智能化产业变革具有重要意义。端侧部署具备实时性、低时延优势,能够灵活支持弱网或无网等丰富场景,为终端用户提供更流畅、稳定的交互体验;同时端侧支持信息本地化处理,可有效保护用户数据与隐私安全;端侧计算还将大幅缓解云端算力压力,端云协同更会驱动产业降本提效,加速实现大模型技术的应用普惠。

然而,大模型端侧推理部署仍面临巨大挑战。区别于云端推理部署计算资源应用尽用,端侧部署大模型并实现产品级应用,则需综合考量不同应用间的计算资源分配,以及计算效率、带宽占用与功耗等各项指标。如何在众多约束条件下最大程度地提高大模型端侧推理效率是面临的首要技术挑战。此外,推理过程将大量占用内存带宽,如何在不影响推理结果的前提下减少内存访问,降低带宽依赖,进而减少推理耗时,则需要在软件工程层面进行系统优化。

作为软硬协同技术路径的坚定践行者,地平线通过硬件资源的最大化利用和软件工程的极致优化,并成功在5 TOPS算力的边缘计算芯片上部署高达14亿级参数的大语言模型。这源于旭日3所搭载的双核BPU®️伯努利计算单元对神经网络计算的原生性支持,能够在处理大语言模型方面提供高性能、低功耗的计算处理能力。另一方面,地平线通过软硬协同编译,采用算子重写、算子重排、算子融合和KV-Cache等技术,进一步优化了模型结构,实现推理速度的成倍提升。

从资源占用情况看,该大语言模型在旭日3上的应用效果表现优异,CPU占用单核60%、BPU占用单核50%,为后续其他应用预留充足的算力资源;同时在5GB/s内存带宽基础上实现了约4~5字/秒的生成速度,可充分满足实时性需求;在最能体现真实效能的FPS/Watt指标上,该模型的运行效能相较于LLaMA.cpp等纯CPU方案提升了2.5倍。这也意味着,旭日3对此大预言模型的支持性可达到产品级应用水平。

地平线现已通过GitHub开放该模型的推理代码,开发者可通过RDK X3系列开发者套件,即刻前往「NodeHub全开源机器人应用中心」推荐项目,尝鲜体验大语言模型在旭日3上的实际运行效果,更期待各位开发者参与「星光之路」活动,一同探索大模型在旭日3的上层应用落地!

我们相信,通过软硬协同的技术路径,大模型端侧应用部署将驱动人机交互方式变革,多维度提升用户智能化体验,加速“智能计算平权”时代的到来。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
BSS138NH6327 1 Infineon Technologies AG Small Signal Field-Effect Transistor, 0.23A I(D), 60V, 1-Element, N-Channel, Silicon, Metal-oxide Semiconductor FET, GREEN, PLASTIC PACKAGE-3

ECAD模型

下载ECAD模型
$0.14 查看
C0805C475K4RACTU 1 KEMET Corporation Capacitor, Ceramic, Chip, General Purpose, 4.7uF, 16V, ±10%, X7R, 0805 (2012 mm), -55º ~ +125ºC, 7" Reel/Unmarked

ECAD模型

下载ECAD模型
$0.26 查看
FDV304P 1 Fairchild Semiconductor Corporation Small Signal Field-Effect Transistor, 0.46A I(D), 25V, 1-Element, P-Channel, Silicon, Metal-oxide Semiconductor FET,
$0.32 查看
地平线

地平线

地平线是边缘人工智能芯片的全球领导者。得益于前瞻性的软硬结合理念,地平线自主研发兼具极致效能与开放易用性的边缘人工智能芯片及解决方案,可面向智能驾驶以及更广泛的通用 AI 应用领域,提供包括高效能边缘 AI 芯片、丰富算法IP、开放工具链等在内的全面赋能服务。目前,地平线是国内唯一一家实现车规级人工智能芯片量产前装的企业。

地平线是边缘人工智能芯片的全球领导者。得益于前瞻性的软硬结合理念,地平线自主研发兼具极致效能与开放易用性的边缘人工智能芯片及解决方案,可面向智能驾驶以及更广泛的通用 AI 应用领域,提供包括高效能边缘 AI 芯片、丰富算法IP、开放工具链等在内的全面赋能服务。目前,地平线是国内唯一一家实现车规级人工智能芯片量产前装的企业。收起

查看更多

相关推荐

电子产业图谱