• 正文
  • 相关推荐
申请入驻 产业图谱

OpenAI重磅发布Agent开发套件,AI 自主操作计算机时代来临!

10小时前
360
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

2025年3月12日,OpenAI正式发布Agent 开发套件,旨在让AI能够自主操作计算机。这一系列工具与API的推出,标志着AI技术在自动化任务执行领域迈出重要一步。

全新的Responses API深度融合了对话式API的交互简洁性与助手API的工具调用能力,为开发者提供了统一的接口范式。该API支持动态任务解析与工具链自主调度,显著降低了复杂业务流程的架构复杂度。

内置工具包括网络搜索文件搜索计算机使用等功能,极大地扩展了AI的应用场景。Web搜索工具支持GPT-4o和GPT-4o-mini模型,能够获取网络最新信息并提供清晰的引用。

升级后的文件搜索工具支持多种文件格式,还能优化查询、过滤元数据、自定义排序。计算机使用工具由与Operator相同的Computer-Using Agent (CUA)模型提供支持,可捕获模型生成的鼠标和键盘操作。

全新的Agents SDK基于Swarm框架升级,用于协调单代理和多代理工作流。集成的可观测性工具则用于追踪和检查智能代理工作流的执行情况,确保任务的高效完成。

在Responses API的加持下,开发者只需调用一次API,即可利用多种工具和多轮模型交互解决复杂任务。这一设计极大地简化了智能体的核心逻辑、编排和交互,降低了开发者构建智能体的入门门槛。

OpenAI表示,将继续全力支持Chat Completions API,为不需要内置工具的开发者提供新模型和功能。基于Assistants API测试版的反馈,他们已经把关键改进整合到Responses API中。

价格方面,Web搜索每千次查询分别为GPT-4o搜索30美元和GPT-4o-mini搜索25美元;文件搜索每千次查询2.5美元,文件存储0.1美元/GB/天(首GB免费);计算机使用工具则按每输入百万token/3美元和每输出百万token/12美元计费。

点赞
收藏
评论
分享
加入交流群
举报

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录