-
_NEWSDATE: 2025-07-19 | News by: 智东西 | 有0人参与评论 | _FONTSIZE: _FONT_SMALL _FONT_MEDIUM _FONT_LARGE
智东西AI前瞻7月18日报道,今日凌晨,OpenAI正式推出了ChatGPT Agent,一个整合了网页交互、深度检索和代码能力的全新“AI助手形态”。
从产品逻辑上看,网络交互工具Operator和深度信息检索工具DeepResearch不再分家,ChatGPT内部出现了一个能够“查找-思考-执行”一体化的Agent,用户能直接让AI跨网页、代码、个人数据源完成完整任务。
相较于OpenAI接连被挖角引发的舆论热度,ChatGPT Agent的发布似没达到“革命性Agent”的期许,略显反应平淡。社区用户体验后褒贬不一,有人认为“初见AGI的雏形”,但也有人指出PPT排版简陋、复杂逻辑易中断和幻觉等问题。
ChatGPT Agent发布后,竞品Manus第一时间接招,放出10个实测案例,试图通过财务建模、生活规划、行程安排、消费购物、航班筛选等不同场景任务,证明ChatGPT Agent在任务闭环和可视化交付上并不占优。
▲(图源:Manus X平台)
回过头来看,ChatGPT Agent在网页浏览、执行任务等多个测评中实现了SOTA,在“人类的最后考试”(Humanity’s Last Exam)测试中取得了41.6的高分。这一成绩证明了其能力,也同时需要进一步在真实场景中验证。
ChatGPT Agent将首先向Pro、Plus和Team用户推出,Pro用户每月可获得400次查询,其他付费用户每月40次。面向企业和教育用户的版本,预计将在本月底前上线。
目前,ChatGPT Pro版的订阅价格为每月200美元,包含Agent和终端功能。相比之下,xAI的Grok 4最新的Agent产品定价高达每月300美元,两者价格相差1.5倍。
一、一次“功能拼图”的交付,ChatGPT Agent有哪些升级?
ChatGPT Agent的定位可以简单理解为“把Operator和DeepResearch合并”,并补上了一个“终端”和“图像生成API”的工具栈。
1、文本浏览器(DeepResearch功能)负责批量搜索网页、阅读长文本;
2、可视化浏览器(Operator功能)负责网页点击、拖拽和表单填写;
3、终端可以跑Python脚本、生成和分析文件(Excel表格、PPT幻灯片)和调用API,甚至接入Google Drive、GitHub等外部数据;
4、图像生成API补足基础的可视化内容生成,可以为报告或幻灯片创建视觉素材。
这套“工具箱”搭载在一个虚拟机环境下,由经过强化学习训练的模型调度,能实现从自动检索、分析、生成文档,到最终下单、预约的完整闭环。
在发布演示中,OpenAI选择了一个贴近生活的案例:用Agent帮用户策划一场婚礼行程。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见