作者 | 方文三
在当前的年度背景下,特别是针对国内市场,大模型的落地实施将主要聚焦于to B服务领域。随着大模型推理部署的成本持续下降,to C的应用探索也将逐渐增多,这有望为市场带来更多创新型的超级应用,从而推动整个行业的进一步发展。
硅基流动成AI应用[卖铲人]
近日,硅基流动(SiliconFlow)成功完成了总金额接近亿元人民币的天使+轮融资。
此次融资由某知名产业方担任领投角色,跟投方涵盖了智谱AI、360以及水木清华校友基金等业内知名企业及机构,同时,老股东耀途资本亦继续以超额额度参与本轮融资。
针对公司未来的发展规划,硅基流动将重点聚焦于技术产品创新以及全球商业化的推进。
公司将持续优化自主研发的SiliconLLM和OneDiff推理引擎,致力于提升模型的推理效率和用户体验。
此外,硅基流动还将对SiliconCloud平台进行进一步升级,持续推出高效能、低成本的AI模型云服务。
硅基流动的创始人袁进辉,曾任OneFlow和微软亚洲研究院的主管研究员,其研发的LightLDA系统曾荣获微软亚洲研究院院长的特别嘉奖。
硅基流动成立于2023年8月,旨在构建规模化、标准化、高效能的生成式AI计算基础设施平台。
公司提供包括模型云服务平台SiliconCloud、大语言模型推理引擎SiliconLLM、高性能文生图/视频加速库OneDif等在内的多款产品,助力企业和个人用户高效部署AI模型。
2016年起,袁进辉所带领的OneFlow团队作为世界范围内唯一专注于研发工业级通用深度学习框架的创业团队,成功推出了高性能分布式深度学习框架。
随着以大模型GPT为代表的技术热潮兴起,OneFlow团队所积累的大模型训练技术和认知得到了充分验证。
2023年,OneFlow团队在处于大模型风口之际,被原美团联合创始人王慧文所创立的大模型公司[光年之外]并购。
随后,[光年之外]因故被美团并购,袁进辉带领团队创立了新公司[硅基流动]。
与大厂相比,硅基流动的核心优势体现在两方面。
①公司具备深厚的大模型技术积累与创新,拥有顶尖的AI Infra技术能力团队和作品,原班技术团队在业界已打造出开源训练框架OneFlow。
②其次,作为创业团队,硅基流动能够快速捕捉到行业需求的变化,并灵活作出相应的适配。
截至目前,硅基流动已经历了两轮融资。今年1月,公司完成了上一轮5000万元的天使轮融资,由创新工场领投,耀途资本、奇绩创坛、美团联合创始人王慧文等跟投,投后估值达数亿元人民币。
核心产品体系已初步成型
硅基流动自主研发的SiliconLLM大模型推理引擎,经过对内核、框架、机制及模型的深度优化,实现了业界顶尖的推理效率,其速度相较于同类开源产品,显著提升超过十倍。
在应对MoE架构、超长上下文处理和超低延迟等复杂场景时,硅基流动的产品展现出业界领先的实力。
硅基流动近期推出了一站式云服务平台SiliconCloud,该平台致力于提供高效能、低成本的多品类AI模型服务(MaaS)。
SiliconCloud不仅集成了全球最新、最顶尖的开源模型,还通过自研的推理引擎套件(SiliconLLM & OneDiff)显著降低了大模型推理的成本,为用户提供了卓越的性能体验。
这使得开发者能够专注于产品创新,无需担忧大规模推广所带来的高昂算力成本。
SiliconCloud汇聚了众多主流大模型,包括阿里旗下的通义大模型Qwen2、智谱旗下的GLM-4、幻方量化旗下的DeepSeek V2系列开源模型,以及文生图模型SDXL、SDXL Lightning、PhotoMaker、InstantID等。
基于硅基流动在AI Infra领域的深厚积累,SiliconCloud平台上的大模型展现出更快的响应速度和更低的算力成本,极大提升了AI应用开发效率,并显著降低了部署成本。
例如,使用SiliconCloud调用文生图模型Stable Diffusion,可以实现1秒出图的高效能;
而调用大模型DeepSeek V2时,其响应速度可达50 Tokens/s。
这得益于SiliconCloud集成的视频生成推理引擎OneDiff,它使文生图模型SDXL的性能加速最高可达3倍。
AI Infra的重要性逐步显现让赛道收益
AI Infra(人工智能基础设施)指的是在大模型生态系统中,除了算力之外,为支持大模型训练和部署流程所构建的一系列底层软件技术设施。
这些设施为开发者提供了便捷高效的设计模型或使用模型的环境,无需过多关注底层算力资源的调配。
AI Infra层,作为衔接AI应用层与算力芯片层的中间环节,其在当前大模型时代背景下扮演着类似[操作系统]的核心角色。
面对如何优化大模型训练与推理的效率,充分发掘底层硬件的潜能,并降低生成式AI应用开发的门槛与成本等挑战,AI Infra层承担着解决这些关键问题的重任。
随着ChatGPT等技术的火热,大模型及其相关应用持续涌现,作为连接算力和应用的AI中间层基础设施,AI Infra的技术和商业发展前景备受瞩目。
当前,大模型的发展尚处于初期阶段,快速构建和训练调优模型成为行业关注的焦点。
然而,随着行业的逐渐成熟和应用层的蓬勃发展,基础设施的支撑作用将日益凸显。
AI Infra不仅为应用开发者搭建了与硬件和模型之间的桥梁,提升了开发效率和创新能力,还能有效满足市场对高性能、低成本AI解决方案的迫切需求。
在国内,AI Infra领域的创新企业包括无问芯穹、清程极智等,二者均背靠清华大学,得到了来自智谱AI等投资者的支持。
其中,无问芯穹由清华大学电子工程系主任汪玉发起,创始人夏立雪为其学生;而清程极智的创始人则来自清华计算机系。
在国际上,英伟达、亚马逊、Lepton AI、OctoAI等企业以及伯克利大学开发的vLLM等也在此领域展开竞争。
与文心一言、通义千问等应用层大模型产品相比,硅基流动所聚焦的AI Infra赛道更注重连接算力和应用的AI中间层基础设施,涵盖了数据准备、模型训练、模型部署和应用整合等多个环节。
据中金数据预测,目前AI Infra产业正处于高速增长的发展初期,预计未来3—5年各细分赛道有望保持超过30%的高速增长。
结尾:
展望未来,随着模型的不断升级、架构的优化以及定制芯片等降本增效措施的深入推进,AI应用的盈利能力有望实现显著提升,进而逐步凸显AI应用层的价值。
在此过程中,与开发者紧密关联的AI Infra生态位将展现出显著的优势。
同时,值得注意的是,未来AI模型的参数量将呈现持续增长的趋势。
当模型规模扩大,现有的深度学习框架可能无法满足开发者的实际需求,这就要求对底层的AI框架进行重构。
这不仅是技术进步的必然,也为创业公司提供了新的发展机遇。
部分资料参考:创投日报:《智谱AI、360都投了这家AI应用[卖铲人]》,智能涌现:《袁进辉新公司「硅基流动」获近亿元天使+轮融资》,每日经济新闻:《硅基流动完成近亿元天使+轮融资》,金角财经:《国产AI,逃过一劫》,IPO早知道:《硅基流动再获近亿元天使+轮融资》,晚点LatePost:《光年之外联创再出发,与袁进辉聊 AI Infra到底做什么》,AI科技评论:《OneFlow 袁进辉再创业,成立新公司「硅基流动」》