独家对话丨MiniMax：「AGI」之路，我们不走「捷径」

作者 | 董子博编辑 | 岑峰

“‘英雄时代’到来，AI 赛道风起云涌，而 MiniMax 却努力地保持冷静和专注。”

加入大模型赛道，魏伟说，他和不少人一样，是“跑步进场”。

在互联网领域，魏伟并非初来乍到——相反，魏伟是一名技术出身的“老兵”。

2006年在百度，魏伟就是百度在云领域尝试的第一批贡献者，和余凯、贾磊、徐伟等大牛同袍同泽。2011年，他也是最早一批开始使用 GPU 驱动深度学习的先锋，支持算力平台。从百度出来，魏伟在2016年加入了正在高速发展期的腾讯云任职副总裁，在技术和业务层面都有涉猎。

中间，魏伟又经历了一段创业，而也是在这时，ChatGPT 横空出世，让 AGI——这个一度被视为“口号式”的人工智能愿景——展现出了新的可能性。

面对这个可能颠覆科技界的机会，魏伟怎能不心动？在介绍之下，魏伟遇到了 MiniMax。魏伟发现这个年轻的团队对人工智能未来发展趋势的理解十分深刻，并且也坚定地相信着 AGI。

于是，“跑步进场”的魏伟加入了 MiniMax，担任副总裁和开放平台负责人，帮助 MiniMax 在 B 端发展开放平台，拓展业务。现在，MiniMax 已经成为了一家大模型独角兽公司。

近日，雷峰网来到了 MiniMax 北京办公室，和魏伟进行了一次深谈。也是在这次谈话后，有关 MiniMax 的很多疑惑，也都在不同程度上获得了解答。

MiniMax 是谁？

在外界，MiniMax 这个名字并不“响亮”——甚至不少 AI 领域的从业者，都从来没听过这个名字。

如同“锦衣夜行”，MiniMax 鲜少对外发声，鲜少参与测评，也鲜少主动发布自己的产品。事实上，和雷峰网的对谈，是 MiniMax 的高管首次面对媒体，直抒胸臆。

既有头部资本的支持，又有米哈游、腾讯、小红书等大厂的青睐。单从这一点来看，虽然没有主动制造“神秘感”，MiniMax 正伫立在聚光灯下，作为中国 AI 的新生代力量被密切关注着。

MiniMax 是谁？在魏伟的描述中，雷峰网看到了很多个“面相”。

AGI的信仰者

从几位早期成员，到今天 MiniMax 近200人的整体团队，平均年龄在95后左右，还有不少00后。

（在 AI 2.0 的“英雄时代”中，涌现了一大批年轻有为的85后、90后创业者，雷峰网后续将持续关注和报道他们的故事和成果，欢迎添加作者微信：william_dong，交流认知，互通有无。）

魏伟来到 MiniMax，主要工作之一就是组建开放平台团队。不少入职的员工，都经过魏伟的亲自面试。

单是招人这一关，MiniMax 的标准，就足以管中窥豹，看到他们企业文化的一个侧面——每个加入 MiniMax 的候选人，都需要对技术和产品有足够的信念感。

这种对于 AGI 的信仰，体现在很多方面。比如，MiniMax 并不特别青睐更了解传统 NLP 或 CV 技术的“老人”，也并不强求新人具有多厚重的经验和背景。

“其实在大模型上，我们讲泛化能力；我们用一样的方式看人——应用到人身上，我们招人更讲究‘通才性’。”魏伟说道，“（我们招人）已经不再局限于必须得是计算机出身。我们也发现，很多数学、物理，甚至文学、心理学出身的人，都会有实际输出。”

在过去，不少头部 AI 公司招人，很多的关注都被放在：拿过多少竞赛奖项、发过多少顶会的 Paper……而这些“名头”，MiniMax 却并不强求，反而对很多进取、活跃、没有包袱的年轻人广开大门。

“大模型赛道还存在着太多非共识，既然我们也没完全弄懂，干脆和新朋友一起学习和成长。”魏伟对雷峰网表示道。

低调的“野心家”

MiniMax 的低调，已经几乎成了一种“习惯”。

而当问到为什么他们更享受这种“神秘”的感觉的时候，魏伟对雷峰网说，他们并非刻意在保持一种“神秘”，而是真的觉得，自己的技术还并没达到能够让内部觉得“拿得出手”的程度：

“我们的技术还没能让我们满意，所以就不会贸然公布什么——在我们还没能达到自己期待的时候，过多‘抛头露面’，反而消耗的是市场和社会，对大模型事业的期望值。”

有一个投资人对雷峰网说过：在赛道过热时，能体现出一家公司定力的，不是他们在这个时刻做了什么，反而是他们选择不做什么。

这种定力，是体现在公司对于 AGI 的“野心”。

“如果大家都在现阶段水平下“卷”，其实没有任何意义，目前距离实现真正的AGI仍然有很长的路要走。我们的目标是在算法上持续保持领先，在业务上始终为用户创造实际的价值。”这种“野心”，在 MiniMax 的身上体现相当明显。但也正是这种“野心”，让 MiniMax 显得更加谦逊。

然而事实上，MiniMax 在技术上的实力从成立至今一直保持领先水平，也是目前国内少有的拥有文本、语音、视觉三模态融合的通用大模型引擎能力，并打通产品全链路的创业公司。

对于全链路自研，MiniMax 的目标相当执着，目前模型每周都会做迭代更新，这对整个系统有着非常高的算法要求和工程标准。

“不少人质疑我们的算法是不是‘套壳’——对于我们来说，这甚至称得上一种褒奖。”魏伟对雷峰网说道。

MiniMax 在做什么？

在算法能够初步达到面向市场的程度之后，MiniMax 一直致力于 “User-in-the-Loop” 的产品研发模式，并且还取得了不错的成绩，而由此取得的用户反馈数据，也为算法的进一步提升打下了坚实基础。

但 MiniMax 还不满足于此，在算法日渐成熟之后，他们把眼光转向了 B 端市场。魏伟所负责的面向企业及用户的开放平台，就是 MiniMax 意在利用大模型改变市场的矛头先锋。

做 To B 和做 To C 的逻辑完全不同，大模型更是如此——To B 的产品要能实打实地带来生产力和使用体验的提升。

魏伟表示：“一个 C 端用户通过低廉，或免费的方式，获取大模型对他们问题的解答，或许有不少人愿意买单。但 B 端用户是否愿意为大模型付费，支撑公司的营收，中间其实还有一道鸿沟——很多 B 端客户不会轻易掏这个钱。”

而跨越这道鸿沟，MiniMax 选择的方法无他，只有通过加深对场景的理解能力，来发展出更具优势的技术。MiniMax 开放平台目前已接入数百家企业客户，打通办公协作、智能硬件、教育、医疗、客服等十余个行业场景。

“首先还是基于我们过去一年的研发能力积累，整套研发链路跑通后，我们会基于我们的算法能力来帮助客户在实际场景中对齐输出效果。”

以办公场景为例，MiniMax 为金山办公旗下的智能办公助手 WPS AI 提供多种大模型能力。

结合办公场景的业务需求，大模型可以帮助用户完成文本生成、要点总结、任务分发、表格和演示生成等任务，以让办公更流畅、高效、智能。

如果你参加今年的 WAIC，在 WPS AI 的展区，MiniMax 将联合金山办公，完成一场技术分享会，推介他们最新的技术研发成果。

为了能让算法对于文档场景的理解能更加深刻，做文章、故事的续写，乃至到代码的生成，MiniMax 不仅有团队全时派驻在客户的公司，来帮助厂商获得更好的“使用姿势”；同时还更是分出人力，一家家地跑了不少业务相关小公司，有不少甚至只是五六个人的工作室，Case by case 地收集案例和使用需求，借此来实打实地帮助算法层面的更新。

在落地的过程中魏伟带领的开放平台团队就是如此，跨越了一个又一个挑战。今天在办公文档领域，MiniMax 的算法已经可以帮助客户处理超过16k的长文、支持和优化摘要和缩写格式的输出、更准确直接地理解用户的需求，甚至生成代码，让处理文档的算法，从一个“文科生”往“理科生”的方向上转变。

而当被问起时，对于过去经历的难题，魏伟似乎并不完全在意。“都是已经被解决了的问题，”他说，“我们更关注的是下一个我们将要迈过的‘坎’。”

以技术突围，MiniMax 已经在多个领域有了不少落地的案例：

在企业服务场景中，MiniMax 与腾讯轻联做了许多关于打造个人工作生活“小助手”尝试，在其已有工具上做模型转化后能力输出，拉通大模型和 SaaS 产品的融合使用；

与掌阅科技合作的对话式 AI 应用“阅爱聊”，能让文学作品中的角色来到现实，与用户展开一场“跨次元”对谈；

而与金山合作的 WPS AI，则已接入了 WPS 矩阵中文档、演示、表格中大量场景，在智能办公领域提供了不少新的可能，与上面提到的“阅爱聊”一同，入选了“北京市通用人工智能大模型行业应用典型场景案例”；

而与小米，MiniMax 也展开了深入的合作——MiniMax 开放平台为小爱同学（小米的智能语音助手）在智能硬件、商城助手等场景赋能，具体包括闲聊、角色扮演、知识问答、信息提取等相关能力。

MiniMax 要去哪？

MiniMax 最重要的企业文化是“不走捷径”。

在 To B 生意上已经生根发芽，但这对于一家有“野心”的大模型公司来说，要保持技术领先并持续打通产品和业务链路，走向通用人工智能的终极目标，这只能算是一个阶段性成果。

因为核心团队都亲历过 AI 1.0 时代，MiniMax 决定不走捷径，把“与用户共建智能”（Intelligence with Everyone），作为公司立身发展的第一性。魏伟坚定表示，“始终基于用户需求，这样算法才能不断突破临界点，我们也才能为越来越多的客户带来实打实的价值。”

这势必是一场持久旅程。当下，大模型算法的天花板还没能看到，MiniMax 起步虽然不晚，但在数据和场景的积累上，还依然需要很多沉淀。

而 MiniMax 也绝不单纯只是“眼望星空”的空想家，在“脚踏实地”的层面，他们也勇敢地面对接踵而来的挑战。

一位圈内人士对雷峰网表示，大模型从一项“技术”变成能实际变成生产力的“产品”，中间有很多复杂的工程问题需要解决。而能否解决这些工程问题，则是众多 AI 公司能否“落到地面”的关键细节。

而大模型 To B 做 MaaS，也就是“模型即服务”，部署就是这样一个相当微妙的工程问题：

一方面，要做云端部署，不少客户，尤其是身处医疗、金融行业等对保密性、安全性要求更高的企业，对于云端部署的不确定性相当介意；

另一方面，企业承担私有化部署的成本非常高。而当下很多小模型由于算法能力不足，尽管企业针对私有数据进行 fine-tune，仍然很难达到业务上线标准，反而会让企业花更多成本踩“坑”。

魏伟和团队认为，只有当模型能力足够通用之后，企业买私有化部署的模型才能产生足够大的价值，这样才能实打实的解决企业问题。

不少厂商给出的解决方案，是做一套更小的模型，降低私有化部署的压力，通过一定程度牺牲模型能力，来换取更加低成本的产品落地。但这里必须要解决更新速度的问题，不然会很难跟上技术发展。

魏伟认为，不管哪种解决方案，只有能真正让企业在业务上获得提升，才是真正有价值的。

MiniMax 在模型性能上不想妥协，那么部署问题就必须被解决。

而这个问题，难不倒云业务出身、SaaS 经验丰富的魏伟和他带领的开放平台团队。MiniMax 给出的方案，是“云上专区”部署。

针对客户基于安全性的需求，MiniMax 和多家云厂商达成了合作，模型提供方把模型在云端放置在一个相对封闭的专区中，只具备日常更新和 Debug 的权限；云厂商只作为审计第三方，通过堡垒机和安全审计来防止非法的下载。

这种单向的链路，让无论模型提供方还是云厂商，都无法直接下载用户的数据，安全性就得到了很大程度上的保障。

同时在这个模式下，模型直给应用，用户通过 API，可以直接调用专属的集群，模型提供方实时的模型更新，用户也能第一时间接收到成果。

这种“云上专区”在美国有不少尝试者，而这种模式也正逐渐为 MiniMax 国内的各个大客户所接受。

结语：不走捷径的MiniMax

不少了解 MiniMax 内情的人，会用“外佛内卷”来形容这家公司。

对外，MiniMax 足够“佛”。他们知道过多的关注会给团队的心态带来不确定的影响，于是“谨言慎行”，能够不受外界影响，专研开发的状态，严谨而“孤独”。

对内，MiniMax 却很“卷”。他们的更新迭代始终保持在一个很高的节奏上，因为距离真正实现AGI，对所有人来说都还很遥远，必须要保持足够快的进步速度。

因此，评价这家年轻的创业公司，尽管团队和公司的年龄都不大，却总能让人感受到一种不似新创公司的“老成”。团队有激情、有拼劲，公司文化也更直接，对事不对人。一位猎头向雷峰网表示，现在上海能从字节逆向挖人的，除了刚在拼多多对面开办公室对着挖拼多多和字节增长岗的 Shein，就是 MiniMax 了。

MiniMax 之所以“有所为，有所不为”，是因为他们把“与用户共建智能”，看得比什么都重。

在内部，MiniMax 常常用“造一艘火箭”来形容自己的状态——在火箭成功上天之前，一切都应该踏踏实实为技术发展服务。

有了解 MiniMax 的人分析，以 MiniMax 的算法演进，目前在中文能力上在不少复杂场景已经可以平替 GPT3.5，而 GPT-4 似乎也不再只是一个“可望不可及”的目标。（当前MiniMax 开放平台已上线其最新版本的文本模型 “MiniMax-ABAB 5.5” ，欢迎申请体验：https://api.minimax.chat/）。

去往 AGI 的路途虽然仍然遥远，在今天可能只写完了一个“序言”。而明天，对于MiniMax 来说，仍如同黑夜中的海洋，充满着未知的风浪。好在，远处仍然有一座灯塔，还闪烁着依稀温暖的光芒——只要心中仍有对 AGI 的信仰，MiniMax 就不至于迷路。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
AT89C51CC01UA-RLTUM	1	Atmel Corporation	Microcontroller, 8-Bit, FLASH, 8051 CPU, 40MHz, CMOS, PQFP44, GREEN, VQFP-44	ECAD模型下载ECAD模型	$7.76	查看
ATXMEGA16A4U-AUR	1	Microchip Technology Inc	IC MCU 8BIT 16KB FLASH 44TQFP	ECAD模型下载ECAD模型	$2.86	查看
ATXMEGA256C3-AU	1	Microchip Technology Inc	IC MCU 8BIT 256KB FLASH 64TQFP		$9	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

AT89C51CC01UA-RLTUM

Atmel Corporation

Microcontroller, 8-Bit, FLASH, 8051 CPU, 40MHz, CMOS, PQFP44, GREEN, VQFP-44