近日,后摩智能推出基于存算一体架构的边端大模型AI芯片——后摩漫界™️M30,最高算力100TOPS,典型功耗12W。为了进一步提升部署的便捷性,后摩智能同步推出了基于M30芯片的智算模组(SoM)和力谋®️AI加速卡。
随着AI大模型部署需求从云端迅速向端侧和边缘侧设备迁移,AI芯片的性能、功耗和响应速度面临前所未有的挑战。后摩漫界™️M30芯片兼具高性能与低功耗特性,可满足边端侧大模型部署对高效率和实时性的严苛要求。
后摩漫界™️M30
M30是一款通用的边端大模型AI芯片,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问等。以Qwen1.5-7B-Chat为例,M30的运行性能可达15-20 Tokens/s。
基于M30芯片的智算模组(SoM)支持PCIe EP模式,以其小巧的体积、强劲的性能和极低的功耗,成为小型化设备和功耗敏感嵌入式场景的理想选择。此外,基于M30芯片的力谋®️AI加速卡作为标准的半高半长PCIe加速卡,能在PC、一体机和服务器中实现快速部署,支持主动散热和被动散热两种模式,确保设备在不同环境下的稳定运行。
后摩漫界™️M30将以“+AI”的方式,为传统的端侧和边缘侧设备注入强大的大模型能力,现已成功适配包括X86、ARM在内的多种主流处理器,可广泛应用于AI PC、边缘AI一体机、智能座舱、商用显示、智能融合网关,NAS(网络附加存储)等领域,为AI技术在更多领域的深入应用注入强大动力。