张通社 zhangtongshe.com
5.0”大模型亮相前夕,商汤科技再获20亿港元投资。
近日,商汤科技在港交所发布公告,宣布了一笔通过配售获得的20亿港元投资,多家战略投资人及头部基金入股,现有股东增持。资金将用于扩大商汤科技大装置规模、支持大模型研究及产品开发的生成式AI 进一步发展。
商汤科技成立于2014年,是人工智能算法供应商,专注于计算机视觉和深度学习原创技术。2021年,公司在港股上市,成为港股AI第一股,也是“AI四小龙”中首家上市企业。
上市之后,商汤科技却不断亏损。2021年至2023年,商汤科技同期归母净利润分别亏损171亿元、60亿元、64亿元。在下滑的营收和亏损的数据中,生成式AI成为商汤科技的业绩亮点,其年报显示,2023年生成式AI收入突破11.84亿元,实现199.9%的飞速增长,逐步成为其核心业务。
在今年7月,商汤科技还将发布新版大模型,其具备更强的知识、数学、推理及代码能力,综合性能全面升级。
01、2023年,生成式AI业务爆发式增长199.9%
在2023年的业务重组中,商汤科技明确了新的三大业务板块,生成式AI、传统AI和智能汽车。其中,生成式AI业务为其重点发展方向。得益于在生成式AI业务上的不断投入,2023年,商汤科技成功实现了生成式AI大模型从研发到商业化应用的革新。
2023年4月,商汤科技推出“日日新SenseNove”大模型体系,这是商汤科技首个发布的大语言模型之一,同时还包括“秒画”文书图模型、3D内容生成等多种生成式AI模型。
在2023年的7、8月份,商汤科技快速迭代了2.0和3.0版本,通过提高训练数据质量,实现了基础语言能力的显著提升。其新的“模型即服务”商业模式,使客户能够轻松地在大装置微调和调用各类生成式AI能力,无需自己建设和管理底层基础设施。据了解,“日日新”成为国内首个超越了GPT
3.5-turbo性能的基模型,也作为首批通过国家备案的大模型,正式面向用户开放服务。
在算力规模上,“日日新”大规模体系实现了突破性增长。据了解,商汤科技大装置的总算力达到12000petaFLOPS,连管GPU数量达45000卡。
对于商汤科技而言,生成式AI不仅仅是AI技术领域的变革性创新,更逐步成为其核心业务。据商汤科技公布的年报显示,“日日新”大模型+大装置带动生成式AI收入突破11.837亿元,业务实现199.9%的爆发式增长,占集团收入的比例由2022年的10.4%提升至34.8%。这是商汤科技成立十年以来,以最快速度从无到有、超过10亿元收入体量的业务。
在弗若斯特沙利文发布的《2023年中国AI开发平台市场报告中》,商汤科技在增长指数和创新指数两大评估维度的综合评分中位居国内首位。这一成绩不仅展示了商汤在生成式AI领域的领先地位,更是对其创新能力和市场扩张速度的国际认可。
02、获20亿港币投资,将用于AI大模型
2024年,国内的“百模大战”进入深水区,MiniMax、智谱AI、讯飞星火、华为、抖音等企业相继推出大模型。作为已入局者,商汤科技不断追求创新,提升大模型技术实力。
今年2月,商汤科技发布了“日日新”4.0版本,它在代码编写、数据分析和医疗问答等多种场景中达到与GPT-4相匹配的能力。同时,商汤科技开源了7B和20B两种参数规格的基模型InternLM2,其性能超过了Meta的Llama2和Google的Gemma等同级别开源模型。此外,“秒画”文生图模型也经历了四次更新至4.0版本,提升到百亿参数量,叠加十倍级推理加速的优化。
为了进一步巩固并扩大商汤科技在大模型、大装置领域的领先地位,6月21日,商汤科技在港交所发布公告,根据一般授权配售新B类股份。在香港联交所交易时段前,配售1673446000股配售股份,每股配售价为1.20港元。商汤科技表示,目前通过配售已获得20.08亿港元投资,多家战略投资人及头部基金入股,现有股东增持。
据了解,配售事项的所得款项净额将主要用于继续扩大商汤科技的领先优势,包括扩大商汤科技大装置规模、支持大模型研究及产品开发的生成式AI 进一步发展,以及用作公司的一般营运资金。
在2024年战略目标中,商汤科技也不断强调将着力发展大模型。具体来说,将进一步发挥“大装置+大模型”的深度协同优势,持续扩充算力规模、提升基础设施和大模型的综合服务能力;持续投入日日新模型体系的迭代,让模型能力保持业界领先。
同时,商汤科技还将致力于实现大模型推理效率提升的摩尔定律,通过云+端结合等创新优化策略,让模型推理成本迅速降低,从而打开更广阔的应用场景。
03、“日日新SenseNova 5.0”大模型发布在即
在7月的WAIC世界人工智能大会上,商汤科技将发布其新版大模型——“日日新SenseNova 5.0”。
“日日新SenseNova 5.0”大模型,具备更强的知识、数学、推理及代码能力,综合性能全面升级。这主要得益于以下三个方面的提升:一是采用混合专家架构(MoE),激活少量参数就能完成推理,且推理时上下文窗口达到200K 左右;二是基于超过10TB tokens训练、覆盖数千亿量级的逻辑型合成思维链数据;三是商汤AI大装置SenseCore算力设施与算法设计的联合调优。
日前,中文大模型测评基准SuperCLUE发布最新榜单,对商汤科技全新升级“日日新SenseNova 5.0”大模型进行了全方位综合性测评,结果显示在SuperCLUE综合基准上,日日新5.0以总分80.03分的优异成绩刷新国内最好成绩,这也是国内大模型首次在SuperCLUE中文基准测试中实现登顶。
在端侧大模型应用上,为了满足移动终端用户对大模型技术的应用需求,商汤科技推出日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。其日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。
对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤科技正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。
此外,商汤科技前瞻洞察中心化算力需求向端侧扩展的未来趋势,以及企业级在边缘侧的AI需求,在业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。
凭借在大装置+大模型深度协同优势、云端协同能力,以及多场景落地的丰富经验,商汤科技将在人工智能2.0的风口上实现长远的飞跃式发展。
文字|张文琪 编辑|吕颖颖