奥运会一直是高精尖科技争相亮相的舞台,一方面它是前沿技术最好的试炼场,另一方面也是出于高水准赛事的迫切需求。随着生成式AI的发展和推广,这项技术正在奥运会上展现出新的落地方向和应用空间,不论是提升运动员表现、优化赛事管理,还是增强观众体验等方面,都为即将到来的2024年巴黎奥运会注入了新的活力。
日前,英特尔分享了与国际奥林匹克委员会(IOC)的一些合作细节,并披露了以行业需求为导向所打造的生成式AI(GenAI)检索增强生成(RAG)解决方案。该成果深度展示了英特尔如何通过基于至强处理器和Gaudi AI加速器的开放式AI系统及平台,帮助开发者和企业应对AI高速发展所带来的需求。
基于生成式AI RAG的聊天机器人,跨越数据障碍
AthleteGPT是国际奥委会与英特尔合作开发的一款聊天机器人,是一款基于英特尔至强处理器和Gaudi加速器的RAG解决方案,它可以说六种语言,包括英语、法语、西班牙语、普通话、俄语和阿拉伯语,11,000名运动员将能够访问这些语言,这几乎涵盖了他们的第一或第二语言。它不仅能够应答运动员的日常询问并进行互动,同时将在运动员入住巴黎奥运村期间,为其按需提供信息,使运动员能够专注于自身训练和比赛。
对于奥运会这样的国际大型赛事来说,英特尔通过与国际奥委会的合作,展示了AI普及化的一种方式。尽管这种获取信息和互动的方式很好,但毫无疑问,“信息量”是一个主要挑战。一直以来,AI的训练和部署在数据方面存在一定的制约和局限。对于企业来说,他们拥有大量数据,这些数据往往是专有数据或历史数据,是企业宝贵的数字资产。LLM虽然是一项伟大创新,但如果无法安全访问和应用这些数据的话,也无法发挥力量。
英特尔方面认为,RAG的技术和范式可以将数据和LLM结合在一起,既可以确保企业数据的安全性,又能够借助企业数据的具体性和准确性,使得LLM发挥出该有的价值。
据了解,AthleteGPT提供了RAG驱动的前端,它可以在幕后检索数据,无需运动员进行复杂操作,就可以有意义地解释大量数据集中的信息。
企业AI开放平台是大规模生成式AI RAG应用的关键
在大规模应用的生成式AI RAG解决方案中,一个重要根基是英特尔与行业合作伙伴共同创建了开源、可互操作的解决方案,用于轻松部署RAG。正是因为企业AI开放平台(OPEA),能够提供开源、标准化、模块化,以及异构的RAG流水线(pipeline),并致力于为开放式模型及多种编译器和工具链的开发提供支持,加速了针对垂直领域用例的容器化AI集成与交付。
下图是RAG的具体工作流程,该生成式AI一站式解决方案将基于OPEA的微服务组件集成至用于部署英特尔至强处理器和Gaudi AI系统的、可扩展的RAG解决方案中,可通过Kubernetes、Red Hat OpenShift等经验证的编排框架进行无缝扩展,并提供兼具可靠性和系统遥测功能的标准化API。
英特尔方面表示,几乎所有大型语言模型(LLM)的开发都基于高级抽象框架PyTorch,该框架受英特尔Gaudi和至强技术的支持,使得在英特尔AI系统或平台上进行开发变得轻而易举。通过与OPEA合作,英特尔为RAG和LLM部署开发了一个开放的软件堆栈,该堆栈针对GenAI交钥匙解决方案进行了优化,并基于PyTorch、Hugging Face服务库(TGI和TEI)构建。
关于生成式AI RAG解决方案的重要意义,英特尔方面认为,部署生成式AI解决方案会带来诸如成本、规模、准确性、开发需求、隐私和可靠性等方面的挑战。作为一种关键的生成式AI工作负载,RAG可以让企业安全地利用专有数据,增强AI产出结果的及时性与可靠性。这将极大地提高AI应用的质量和实用性。通过以协作的方式帮助开发者构建定制化的生成式AI RAG解决方案,可以满足企业的多样化需求。此外,英特尔亦将持续提供开放、强大且可组合的多供应商生成式AI解决方案。
除了生成式AI RAG聊天机器人,英特尔在支持巴黎奥运会的边缘AI应用中,还携手三星打造基于AI技术的沉浸式互动体验,能够带领观众体验一系列专业的训练与分析,并为其匹配出最为合适的比赛项目。此外,还有帮助视障人士提高赛事观赏体验的AI解决方案,以及包括了全新体积视频的3D播报形式,带给观众沉浸式的实时体验。
当前,如何将最新的AI计算技术应用到实际场景中,并推动关键业务成果落地,是企业亟待解决的问题。通过与广大行业合作伙伴的战略合作,英特尔正为由生成式AI和RAG解决方案驱动的AI服务创造更多的可能性。