AI智能体正处在快速发展阶段,变得更加复杂、自主和多功能,且应用范围在不断扩大。在AI智能体进入“规模就业”阶段前,安全——成为一个不容忽视的问题,企业需要解决信任、物理安全、网络安全以及合规性等关键问题。
应对这一系列问题,日前,英伟达发布了全新的 NVIDIA NIM AI Guardrail 微服务。作为NVIDIA NeMo Guardrails 软件工具系列的一部分,该平台用于 AI 的管理、定制和防护,可帮助开发者在大语言模型 (LLM) 应用中集成和管理 AI 护栏。行业领导企业 Amdocs、Cerence AI 以及劳氏公司 (Lowe’s) 等都在使用 NeMo Guardrails 保护 AI 应用的安全。
直面AI智能体部署挑战,英伟达全新微服务护航
一项对于企业组织采用AI智能体的调研显示,10%已经在使用,52% 计划在未来2-3年内使用,30%计划在明年内使用AI代理,仅有7%没有探索使用的计划。这也表明,大多数组织对采用AI智能体持积极态度,预计在未来两三年内将有大量组织开始实施AI智能体。
企业部署AI智能体面临哪些挑战?英伟达方面指出,需要重点考虑四大因素:安全性(确保不会对企业系统造成安全威胁)、数据隐私(保护用户数据不被未经授权的访问或泄露)、治理(建立有效的管理机制来监督AI智能体的运行和决策过程)、性能(确保AI智能体能够高效完成任务,满足企业需求)。
为了帮助企业在部署AI智能体的过程中,构建起强大的安全性和控制能力,NVIDIA NeMo Guardrails提供了一套全面的解决方案,主要覆盖以下三个环节:
- 定义(Define):根据独特的需求定制安全规则;
- 编排(Orchestrate):高效编排多个专业化的安全规则;
- 执行(Enforce):维护AI智能体的性能,确保安全规则得到执行。
NeMo Guardrails 引入了三项全新的NIM微服务,可帮助AI智能体在大规模运行的同时保持受控行为:
- 内容安全NIM微服务:防止AI生成有偏见或有害的输出结果,确保回答符合道德标准。
- 话题控制 NIM 微服务:将对话聚焦在经过审核的话题上,避免离题或不当内容。
- 越狱检测 NIM 微服务:增加对越狱企图的防护,帮助在对抗性场景中保持 AI 的完整性。
据英伟达方面解释,由于“一刀切”的方法无法有效保护和控制复杂的代理式 AI 工作流,通过应用多个轻量级专业模型作为护栏,开发者可以弥补在只采取较为通用的全局策略和保护措施时可能出现的漏洞。
同时,这也可以在不显著影响性能的情况下,显著提高AI智能体的安全性和合规性。为了在最小化延迟的情况下提高安全性,NeMo Guardrails系列中采用了延迟较低的小语言模型,即使是资源有限的场景或是分布式环境中也能高效运行。
下图显示了随着护栏数量的增加,响应延迟和策略合规性的变化。可以看出,在添加了AI安全护栏的情况下,响应延迟也仅为半秒,同时合规性提高了1.5倍,表明NeMo Guardrails能够在不明显影响性能的情况下,显著提高AI代理的安全性和合规性。
在这些全新微服务中,有一项专为审核内容安全而构建,并使用 Aegis 内容安全数据集 (Aegis Content Safety Dataset) 进行训练,后者是同类中质量较高的人工注释数据源之一。该数据集由英伟达整理并拥有,已在 Hugging Face 网站上公开发布。该数据集包含超过 35000 个经过人工标记的数据样本,这些样本针对 AI 安全和绕过系统限制的越狱企图进行标记。
有了全新的 NVIDIA NIM AI Guardrail 微服务,开发者可以构建更加安全、可信的 AI 智能体。这些智能体能够参考特定语境准则做出安全、适当的回答,并且加强了对越狱企图的抵御力度。它们可被部署在汽车、金融、医疗、制造、零售等行业的客户服务中,提高客户的满意度和信任度。
NeMo Guardrails保障AI安全,正在大范围展开
AI 智能体有望成为能够完成各种任务的“知识机器人”,提升全球数十亿知识工作者的生产力。目前,多个行业已经开始采用NVIDIA的NeMo Guardrails来增强AI应用的安全性和可控性。作为一个开源工具,NeMo Guardrails允许开发者通过编排AI策略来提升大型语言模型(LLM)应用的安全性。这个工具与NVIDIA的NIM微服务,构成了强大的AI系统构建框架,支持大规模部署而不牺牲安全和性能。
全球传媒软件和服务提供商Amdocs、汽车AI解决方案提供商Cerence AI,以及家居装饰零售商劳氏公司(Lowe’s)都在使用NeMo Guardrails来提高客户交互的安全性和准确性。这些公司通过集成NeMo Guardrails,能够提供更安全、更符合语境的AI回答,增强客户服务体验。
此外,NVIDIA在NRF展会上宣布了整合NeMo Guardrails微服务的AI Blueprint,旨在为零售购物助手创造更可靠的客户交互。咨询行业的领导者如Taskus、Tech Mahindra和Wipro也在将NeMo Guardrails集成到他们的解决方案中,以提供更安全、可靠的生成式AI应用。
NeMo Guardrails的开放性和可扩展性使其能够集成领先的AI安全模型和防护提供商的生态系统,以及AI可观察性和开发工具。它支持与ActiveFence的ActiveScore集成,以及与AI可观测性平台Fiddler和端到端AI开发者平台Weights & Biases的集成,增强监控和推理能力。