加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

NVIDIA 通过企业级生成式 AI 微服务 为聊天机器人、AI 助手和摘要工具带来商业智能

2023/11/29
2527
阅读需 5 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 优化语义检索,实现准确的 AI 推理

NVIDIA 今日宣布推出一项生成式 AI 微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成式 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成式 AI 应用。

作为一项语义检索微服务,NeMo Retriever 借助经 NVIDIA 优化的算法,帮助生成式 AI 应用作出更加准确的回答。使用该微服务的开发者,可以将其 AI 应用与位于各个云和数据中心的业务数据相连通。该服务为 AI 代工添加了 NVIDIA 优化的 RAG 功能,并被整合到亚马逊云科技 Marketplace 上的 NVIDIA AI Enterprise 软件平台中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先与 NVIDIA 合作,将生产就绪型 RAG 功能整合至其自定义生成式 AI 应用和服务中。

NVIDIA 创始人兼首席执行官黄仁勋表示:“具有 RAG 功能的生成式 AI 应用是企业的下一个杀手级应用。借助 NVIDIA NeMo Retriever,开发者可以创建自定义生成式 AI 聊天机器人、AI 助手和摘要工具。它们能够访问企业的业务数据,通过准确且有价值的生成式 AI 智能来提高生产力。”

全球头部企业借助 NeMo Retriever 提高大语言模型(LLM)准确性

电子系统设计领导厂商 Cadence 为超大规模计算、5G 通信、汽车、移动、航空航天、消费和医疗市场的企业提供服务。该公司正与 NVIDIA 合作,为工业电子设计领域的生成式 AI 应用开发 RAG 功能。

Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,比如能在设计流程早期发现潜在缺陷的工具等。我们的研究人员正在与 NVIDIA 合作,使用 NeMo Retriever 进一步提高生成式 AI 应用的准确性和相关性,以便发现问题,并帮助客户更快地将优质产品推向市场。”

破解精确的生成式 AI 应用的“密码”

开源 RAG 工具套件不同,NeMo Retriever 是通过具有商业可行性的模型、API 稳定性、安全补丁和企业级支持,来为生产就绪型生成式 AI 赋能。

经 NVIDIA 优化的算法使 Retriever 的嵌入模型能够产出准确性最高的结果。经过优化的嵌入模型能够捕捉单词之间的关系,使 LLM 能够处理和分析文本数据。

企业可以使用 NeMo Retriever 将 LLM 连接到多个数据源和知识库,这样用户就可以轻松地与数据交互,并通过简单的对话指令获得准确且最新的答案。通过使用由 Retriever 驱动的应用,企业可以使用户安全地访问多种数据格式的信息,如文本、PDF、图像和视频等。

借助 NeMo Retriever,企业能够以更少的训练获得更准确的结果,加快产品上市时间,并减少生成式 AI 应用开发产生的能耗。

通过 NVIDIA AI Enterprise 实现可靠、简单且安全的部署

企业可以在几乎任何数据中心或云端的 NVIDIA 加速计算上部署由 NeMo Retriever 驱动的应用,以便在推理过程中运行。NVIDIA AI Enterprise 可支持通过 NVIDIA Triton 推理服务器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 软件进行加速的高性能推理。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
STM32F207ZGT6TR 1 STMicroelectronics High-performance Arm Cortex-M3 MCU with 1 Mbyte of Flash memory, 120 MHz CPU, ART Accelerator, Ethernet

ECAD模型

下载ECAD模型
$13.88 查看
ATXMEGA32A4U-AU 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 44TQFP

ECAD模型

下载ECAD模型
$3.78 查看
STM32H750VBT6 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 128 Kbytes of Flash memory, 1MB RAM, 480 MHz CPU, L1 cache, external memory interface, JPEG codec, HW crypto, large set of peripherals

ECAD模型

下载ECAD模型
$27.62 查看
英伟达

英伟达

NVIDIA(中国大陆译名:英伟达,港台译名:辉达),成立于1993年,是一家美国跨国科技公司,总部位于加利福尼亚州圣克拉拉市,由黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立。公司早期专注于图形芯片设计业务,随着公司技术与业务发展,已成长为一家提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。

NVIDIA(中国大陆译名:英伟达,港台译名:辉达),成立于1993年,是一家美国跨国科技公司,总部位于加利福尼亚州圣克拉拉市,由黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立。公司早期专注于图形芯片设计业务,随着公司技术与业务发展,已成长为一家提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。收起

查看更多

相关推荐

电子产业图谱