数字孪生并不是一个新概念。但通过将其与新一代AI模型相结合,初创公司MeetKai正在投入资源创建有效的互动工具,例如供工厂用于优化生产流程和远程虚拟培训的工具。
MeetKai是一家AI-Metaverse工具公司。MeetKai的CEO James Kaplan 2014年从Harvey Mudd College辍学,为Michael Milken管理私募股权基金(Milken曾经在垃圾债券领域臭名昭著)。
2018年,Kaplan与Marvell的联合创始人Weili Dai在LA共同创立了MeetKai。
可以说,Kaplan是年轻、有天赋的软件工程师变身企业家的缩影,他的好运气、血统和家族关系让他的初创公司成为可能。并不是每个创业者都如此幸运。
Dai解释说,Kai的意思是“Key to AI”。这家初创公司的使命是开发AI工具,在虚拟世界中模拟现实世界。
Kaplan说,MeetKai的工具旨在帮助企业在虚拟世界中以数字化方式映射、构建和复制业务实践、生产车间以及与复杂机器的交互。这些工具使客户能够提供一个虚拟世界,在这个虚拟世界里,员工和客户可以接受远程培训,或通过自然对话(跨越不同地域和语言)更个性化地享受服务。
MeetKai声称自己有很多职业体育界的客户,包括一支NBA球队以及IndyCar和NASCAR车队。据Kaplan称,MeetKai的工具在工业/企业市场“获得了很大的吸引力”。
Attention Is All You Need
最初,Kaplan是被2017年的一篇技术论文<Attention Is All You Need>吸引至AI领域的。该论文的作者提出了一种新的简单网络架构,Transformer,它完全基于注意力(attention)机制,完全省去了递归和卷积。
在Kaplan看来,这篇论文催生了现代机器学习和LLM,而今天的ChatGPT正是基于此。在此之后,MeetKai直接投身于AI领域,不考虑任何2018年之前的AI模型。
Kaplan和他的团队攻克的第一项技术就是开发ChatGPT的前身。Kaplan说:“我们将其应用于搜索。想想看,如果你看搜索是如何工作的,自从Google成立以来,基本上都是在网页上查找文本。如果我搜索Tom Cruise的电影,搜索并不知道Tom Cruise是谁,也不知道电影是什么,它只是在寻找有Tom Cruise的页面。”
矢量数据库
MeetKai的团队没有效仿Bing在2018年的做法,根据页面上的文本进行搜索,而是决定搜索“语义”。
“当有人在搜索某样东西时,它会首先尝试找出他们所搜索的东西的含义。并根据这个意义找到类似的项目。”
Kaplan说,如今,这被称为“矢量数据库”。
一家数据分析软件开发商KX举例解释说:
在自然语言处理中,矢量数据库可用于查找相似文档、执行文本分类或支持问题解答系统。可以对单词嵌入或句子嵌入进行索引和搜索,以识别相关的文本片段或执行语义相似性计算。
Kaplan说,如今,矢量数据库在软件领域很常见,也有一些外溢到半导体领域。但在2018年,“我们比所有人都早了五年,在这个方向上全力以赴”。
Kai说,“最初,我们在对话式AI(conversational AI)方面做了很多技术,这导致了语音助手搜索、baps(band aperiodicity parameter)个性化,所有这些类型的功能。在这一点上,我们已经重现了Google所能做到的很大一部分,但团队只有15人。”
Kaplan表示,MeetKai与其他AI应用初创公司不同,因为“我们真正关注的是AI领域的最新创新”。
包括Google在内的其他公司和现有公司则坚持使用上世纪90年代发明的更熟悉的技术,这些技术逐渐发展,直到Open AI出现,并引发了对ChatGPT和MLM(Multilevel Modeling)的推动。许多公司都面临着扔掉90年代以来所做的一切,并重新开始的挑战。
AI软件公司的一个流行趋势是,打出一个利用AI的商业点子,并创建相应的应用,比如牙科预约或宠物美容的日程安排系统。Kaplan对此不屑一顾:“他们以一种非常标准的模式,将一些无聊的软件应用到他们的产品中。”
凭借公司在AI领域开发的几项IP,MeetKai声称自己正在打造能够打开不同细分市场(如工业/企业)的业务。MeetKai的一项关键功能是“能够以数字方式模拟现实生活中存在的任何事物”,更重要的是,它还能让用户与模拟对象进行“智能”互动。
例如图片、视频和CAD文件。Kaplan说,第一步是从真实文件开始,然后进行虚拟复制。
第二步是在虚拟环境中找出用例,通常在现实生活中完成的业务流程。
这种数字孪生的概念并不新鲜。但MeetKai声称,这家初创公司的AI工具可以将创建数字副本的过程缩短到六个月。例如,MeetKai只花了两周时间就为新加坡的Silicon Box创造了一个完全仿真的东西。
重点并不是以数字方式呈现Silicon Box生产线。相反,MeetKai认为,“Silicon Box Build”的目的是让半导体设计人员和制造商能够以虚拟和远程的方式模拟和优化芯片制造过程。
Silicon Box的远大目标是在全球各地复制拥有1000名员工的芯片代工厂。Kaplan指出,为此,Silicon Box需要快速培训1万多名员工。
此外,晶圆代工厂还面临着在新工厂安装新生产设备的挑战。公司必须派遣专家到那里,对复杂的机器进行长达六个月的校准。如果安装后出现问题,新加坡的另一个团队就必须去修理。Kaplan说:“一台价值1,000万美元的设备可能还需要额外的100万美元的费用,才能使其运转起来。”
TSMC在建设Arizona晶圆厂的过程中,不得不从台湾向Arizona派遣更多的工程师。远程和虚拟培训正迅速成为各地建设晶圆厂的关键因素。
自助服务
Kaplan解释说,MeetKai的下一步是使他们的工具成为“自助式”工具。Kaplan说:“MeetKai与比亚迪在电动车制造领域以及与Silicon Box在芯片制造领域密切合作,但MeetKai了解到这些公司希望严密保护他们在培训、设备操作和优化方面开发的机密。TSMC不想打开闸门,公布一切。因此,MeetKai必须为客户提供‘编辑工具’,使他们能够在MeetKai提供的‘通用元素’基础上定制解决方案。”
MeetKai计划在2024年发布这样的编辑工具。
ChatGPT带来一片哀嚎
事实证明,MeetKai的数字孪生虚拟产品并不依赖于像素流。为了最大限度地提高可访问性,MeetKai让每一种metaverse体验都能在普通网络浏览器和设备上使用。
Kaplan说,但在当今的虚拟世界或metaverse中,一种常见的方法是在数据中心进行远程渲染,以实现像素流虚拟文字。这是利用安装在数据中心的Nvidia GPU实现的。
远程渲染的问题在于成本高昂,部分原因是Nvidia GPU价格很高。Kaplan还指出,如果按分钟、按用户、按云服务器付费,账单就会堆积如山。
他说:“现在情况更糟,因为所有的Nvidia GPU都被用于机器学习工作负载。”
即使你想要像素流,这些GPU的供应也是有限的,而且你能让数据中心为你运行的时间也非常有限。
“LLM和ChatGPT炒作的牺牲品还包括那些需要依赖数据中心渲染来制作电影、特效和虚拟世界的人。”
Kaplan强调说,MeetKai从一开始就与众不同,因为它“极不可知”。它不希望自己的商业模式要求公司坚持购买GPU或头显。
盈利状况
MeetKai的Dai表示,这家拥有60名员工的初创公司预计今年的收入将在500万美元左右。Dai希望今年年底实现盈利。
当被问及Kaplan是如何与Dai联系到一起创办MeetKai时,Dai解释说:“我是通过James的母亲认识他的。”James的母亲Susan Estrich是Dai的朋友,是一位曾担任Harvard Law Review首位女主席的著名律师。
MeetKai及其CEO拥有宝贵的商业关系和名声,另许多科技界的创业者羡慕不已。MeetKai拥有早期的AI专业知识和在工业领域的先发优势,即使没有把握,也有机会证明其AI/metaverse工具是货真价实的。