多模态是AI工业化范式关键，商汤科技第六代大模型开启“百姓日用”新时代

作者：梁红

【摘要】

2025年，全球AI产业进入深水区。

大模型从技术竞赛转向应用落地，行业竞争焦点从参数规模转向性价比与场景适配。

在此背景下，商汤科技于4月10日发布“日日新SenseNova V6”大模型体系及大装置SenseCore 2.0，以多模态原生能力为核心，推动AI从“技术炫技”向“百姓日用”的实质性跨越。

这场技术迭代不仅标志着商汤战略的全面升级，更折射出中国AI产业从“实验室创新”向“工业化落地”的范式转变。

以下为正文：

01、多模态原生模型重构AI能力边界

2025年，“多模态”正成为公众聚焦的热点话题。

传统思维链下，AI已经在文字推理上相对聪明，但最大的问题在于，现实世界远比单一文字复杂得多，人脑的思考其实还包含了看图说话、听声辨位、摸物识形。

因此，语言作为编码过程存在信息损失，很多时候思考与判断需要通过多模态实现，也即更接近人类思考方式的AI。

但达到这一点，却长久以来存在技术壁垒，数据基础、算力、技术理解能力都存在进步空间。

密集的采样、复杂的编码之下，大模型承载的数据量进一步暴增，这对全局记忆能力也提出了考验。

4月10日，商汤科技举办2025技术交流日活动，率先带来新意，推出全新升级的“日日新SenseNova V6”大模型体系，业内少见地向大家展示了多模态长思维链训练、全局记忆、强化学习的技术突破。

在文本与多模态领域的双冠称号，也让业内看见了知识与通用模型的更大可能。

据悉，商汤凭借过去在视觉、感知、生成等领域积累的大量资源，构造超过200B高质量token的多模态长思维链数据，思维链数据最长可达64K，这为大模型解决复杂问题提供了必要基础。

在思维链形成之后，商汤通过引入激励函数等强化学习引擎实现多模态融合，数据分析能力大幅领先行业最好的GPT-4o，进一步提升大模型的应用效率。

技术突破外，商汤的另一个优势在于性价比的重新思考。

与市场上“语言模型+插件式多模态模块”方案不同，商汤通过自研的多模态思维链构建技术和视频压缩算法，实现了文本、图像、视频、音频的深度融合，大大增强了模型实时交互的性能。

值得关注的是，SenseNova V6还有Reasoner这一深度思考的推理版本。

随着大量数据的全新重构，日日新融合模态从基准的5.5到V6/V6 Reasoner实现100%翻倍能力的提升。

在对齐甚至领先于业内最好水平的推理能力基础上，商汤科技、DeepSeek等国内技术巨头，正在逐步刷新世界对人工智能大模型的认知。

02、从“宏大叙事”到“百姓日用”

除了性能，大模型的另一个关键在应用，覆盖面、易用性都至关重要。

过去，人工智能的应用蓝图多集中于城市管理、智能工业、电网、物业等宏大场景，而此类场景往往存在单一性与难闭环的局限性。

随着模型通用性的增长，人工智能的场景已然从过去智慧城市治理、认知边界探索等宏大叙事，转向百姓日用。

AI大模型商业化落地的关键在于客户，而商汤懂模型，也更懂客户。

此次，商汤交流日发布的重点并非技术参数，而是明确指向高频刚需场景，通过“AI工业化”路径实现商业闭环。

面向B端规模化管理与生产力工具，商汤的大模型正重塑行业效率。

举例而言，在公司财务审核、医疗报销、保险理赔等充斥着大量非结构化数据的领域，大模型可通过交叉验证进行风险提示，以全新的视角应对开放性问题。

在智能制造这一行业新风口，商汤大模型利用自主可控的“开悟”平台生成视觉数据，提升端到端自动驾驶决策，调用外部函数实现与现实世界的反馈，加速具身智能的知识获取效率。

在C端交互革命的行业背景下，商汤大模型正抢占全模态商业化入口。

在消费者集中的线上购物场景中，不论是个人的消费比价、购物规划等零碎的小场景，还是平台方接收反馈、广告投放的大型推广场景，商汤的大模型都可为客户提供科学决策，增加闭环价值。

图文、视频等更复杂的多模态领域，也始终是商汤关注的重点。

在流行的短视频行业，商汤大模型技术可自动剪辑高光片段、生成解说文案，进而提升互动广安，一键化的剪辑操作有助于解决短视频创作者素材处理痛点。

总的来看，面对现实世界众多的开放性问题，多模态已然形成刚性需求，这一点是商汤“日日新”带来的新范式。

03、打通技术普惠的“最后一公里”

“站在风口上，猪都能飞起来”，这一道理人人都懂，但怎么抓住风口、甚至提前预判风口则是一门学问。

据悉，早在2018年，当科技行业还远没有大模型概念的时候，商汤科技面对感知智能的技术瓶颈，就在上海市发改委申请了一个千卡并行训练的原型机项目。

尝到了大数据带来的技术红利，商汤于2020年开始启动建设临港商汤大装置，此时业内甚至没有智能计算中心的概念。

此后抓住人工智能机遇的产品不少，但在人工智能产业走向开源的今天，商汤大装置为何是最懂大模型的AI基础设施呢？

商汤科技杨帆在接受记者采访时说到，“过去我们一直强调AI基础设施，但AI基础设施不只是算力，而是算力、算法、数据这三个要素均实现基础设施化”。

这个观点颇为重要，大模型出现的重大意义，实际是帮助AI的创新者和应用者降低门槛、降低成本，优化所有的AI创新者的性价比和效能。

这一点，恰恰是企业能否实现长久发展的核心要义。

2023年上半年，商汤就推出了AI专家服务的模块，助力产业链下游的创新型工作者更好地使用AI基础设施。

从技术层面看，商汤大装置已经将商汤多模态推理应用的成本降到和大语言模型一样。

24年年底，公司曾为国内头部客户提供4款国产芯片的异构混训服务，训练规模达5000卡，却实现了80%的算力有效利用率，远超业内50%-60%的利用水平。

而在具身智能这一高难度领域，商汤凭借着多年的基础性能力积累，帮助用户在视觉算法等领域快速实现商业闭环，通过经验整合打通客户需求的“最后一公里”。

商汤的SenseCore 2.0通过PD分离/通信计算折叠/FP8强化/算子优化等基础设施与模型协同优化，产品在线服务性能较头部厂商提升15%，超行业平均水平25%；离线推理方面，Prefill阶段提速5倍，Decode阶段提速3.5倍。

SenseCore 2.0正通过提供更敏捷、更灵活、效率更高和更可靠的完整服务，去拥抱开源，去提供更加高性价比的一个选择。

从行业整体来看，大算力的市场需求仍在持续上涨，芯片供应链却面临着极大的外部不确定性。

而DeepSeek的爆火告诉我们，想要打造一个有国际知名度的中国企业，需要整个行业的共同托举。

杨帆表示，公司将于2025年发放1亿的代金券赋能全栈行业场景的落地，助力客户与生态伙伴更快推动中国大模型市场化落地，最终达到以普惠AI创造更加美好的生活、更加美好的社会的共同愿景。

当性价比的生死线正在被突破，商汤正在成为大模型技术普惠下沉的行业“托举人”。

04、尾声

2025年的AI竞赛，不再只是参数的军备竞赛，还包括“场景理解力”的终极比拼。

商汤科技的多模态和工业化生态，正在打造“技术-商业-社会价值”三位一体的新范式。

这条路或许漫长，但正如商汤科技董事长兼CEO 徐立在活动的最后所言，“圣人之道无异于百姓之日用”。

AI的未来，必将在千万百姓的日常中生根发芽。