系统级ChatGPT Agent现身,但OpenAI也创新乏力了

财经 (7) 2025-07-18 13:30:17

  炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:界面新闻)

业界就快习惯于在OpenAI的技术盲盒中开不出自己想要的惊喜玩意。

当地时间7月17日,OpenAI按照预告那样发布了ChatGPT Agent。这个采用了公司最重量级产品来命名的AI Agent,一看就被寄予了厚望。

从目前的情况看来,它是已有功能的重组,外加OpenAI模型训练能力的稳定表现。

根据OpenAI的介绍,ChatGPT Agent是将ChatGPT的对话能力、Operator的网站交互能力以及Deep Research的信息研究与整合能力,融合为一个统一的智能体系统。

Operator是OpenAI今年年初发布的一款Agent产品,与Anthropic的Computer Use概念相近,这是一个可以访问网络,处理互联网上的按钮、文本字段等,并为用户执行任务的Agent;同时也是几乎所有掌握通用模型能力的公司都有所布局的一个产品方向。

Deep Research在国内更为人所知,不仅有强大的信息分析与总结能力,还能够以直观的报告方式呈现。它起初是由谷歌Gemini模型率先发布的一项功能,但OpenAI做出来的同款产品体验一度更让人惊艳,因此也成为了这家公司另一个颇受行业认可的作品。

在OpenAI看来,Operator和Deep Research各自的优势都很突出,但短板也很明显。例如,Operator无法进行深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户认证的内容。

“事实上,我们发现用户通过Operator尝试的许多查询实际上更适合Deep Research——因此我们将两者的优势结合在一起。”OpenAI表示。

于是,现在的ChatGPT Agent可以处理诸如“查看用户日历,并根据最新动态简要汇报即将举行的客户会议”等此类请求。它可以智能浏览网站、选择日期、筛选结果、提示安全登录、运行代码,并且生成经过润色且可编辑的输出内容(以PPT或电子表格的形式)来总结分析结果。

具体而言,用户可以通过编辑器中的工具下拉菜单直接激活ChatGPT的新智能体功能,或者在任何对话的任意阶段选择“智能体模式”。

ChatGPT Agent的产品负责人Yash Kumar和研究负责人Isa Fulford在接受The Verge等媒体采访时表示,该产品由OpenAI专门开发的新模型提供支持,该模型尚未命名,它通过强化学习训练以学会使用多种工具(例如文本浏览器、可视化浏览器以及用户可以导入自身数据的终端)完成复杂任务。

前述产品负责人还表示,为开发这款新工具,公司将Operator和Deep Research的团队合并成了一个统一的团队。

此外,OpenAI强调了这项功能的用户控制与安全风险。在执行涉及敏感或重要操作(如提交表单、预订、购买商品或与涉及个人数据的网站互动)前,它会明确向用户获得确认;在起草和发送电子邮件等关键任务中,它需要用户进行主动监督,同时也会拒绝金融交易或敏感法律互动等高风险任务。

这项功能即日起向Pro、Plus和Team版用户开放,企业版和教育版用户将于7月获得使用权限。其中,Pro用户每月近乎没有使用限制(400次),其他付费用户每月可执行50次任务。

OpenAI已经许久没有惊艳过AI世界,这次的ChatGPT Agent同样如此。有行业人士对界面新闻记者表示,ChatGPT Agent还是更偏工程性工作,本质上是OpenAI对已有技术与产品资源的整合和优化,不会对用户体验层面产生太大的冲击。

不过这也再次引发了模型厂商与应用层公司在产品层面如何角逐的话题。很多人将ChatGPT Agent与此前风靡的Manus进行对比,甚至戏称这是OpenAI的“Manus时刻”。

关注AI应用投资的金沙江创投合伙人朱啸虎,此前在社交平台发文将AI Agent创业与互联网早期的个人站长类比,认为网易、腾讯、265.com、Hao123等案例值得这里的创业者参考。他在一句评论中指出,在AI Agent的创业终局里,大模型会吃掉90%的Agents。

因此,就算OpenAI们未来在应用层创新不再成为最出类拔萃的那个,凭借快速跟进、快速迭代的作业能力,以及已有技术与产品资源的整合能力,它还是能够迅速推出一个80分的合格作品,并从它庞大的用户规模中承接住命中的那部分需求。

眼下行业需要等待的答案,就是究竟是OpenAI们先陷入创新者的窘境,还是创业公司们先扛不住资源悬殊带来的碾压。

THE END