-
日期: 2025-07-19 | 來源: 智東西 | 有0人參與評論 | 字體: 小 中 大
智東西AI前瞻7月18日報道,今日凌晨,OpenAI正式推出了ChatGPT Agent,壹個整合了網頁交互、深度檢索和代碼能力的全新“AI助手形態”。
從產品邏輯上看,網絡交互工具Operator和深度信息檢索工具DeepResearch不再分家,ChatGPT內部出現了壹個能夠“查找-思考-執行”壹體化的Agent,用戶能直接讓AI跨網頁、代碼、個人數據源完成完整任務。
相較於OpenAI接連被挖角引發的輿論熱度,ChatGPT Agent的發布似沒達到“革命性Agent”的期許,略顯反應平淡。社區用戶體驗後褒貶不壹,有人認為“初見AGI的雛形”,但也有人指出PPT排版簡陋、復雜邏輯易中斷和幻覺等問題。
ChatGPT Agent發布後,競品Manus第壹時間接招,放出10個實測案例,試圖通過財務建模、生活規劃、行程安排、消費購物、航班篩選等不同場景任務,證明ChatGPT Agent在任務閉環和可視化交付上並不占優。
▲(圖源:Manus X平台)
回過頭來看,ChatGPT Agent在網頁瀏覽、執行任務等多個測評中實現了SOTA,在“人類的最後考試”(Humanity’s Last Exam)測試中取得了41.6的高分。這壹成績證明了其能力,也同時需要進壹步在真實場景中驗證。
ChatGPT Agent將首先向Pro、Plus和Team用戶推出,Pro用戶每月可獲得400次查詢,其他付費用戶每月40次。面向企業和教育用戶的版本,預計將在本月底前上線。
目前,ChatGPT Pro版的訂閱價格為每月200美元,包含Agent和終端功能。相比之下,xAI的Grok 4最新的Agent產品定價高達每月300美元,兩者價格相差1.5倍。
壹、壹次“功能拼圖”的交付,ChatGPT Agent有哪些升級?
ChatGPT Agent的定位可以簡單理解為“把Operator和DeepResearch合並”,並補上了壹個“終端”和“圖像生成API”的工具棧。
1、文本瀏覽器(DeepResearch功能)負責批量搜索網頁、閱讀長文本;
2、可視化瀏覽器(Operator功能)負責網頁點擊、拖拽和表單填寫;
3、終端可以跑Python腳本、生成和分析文件(Excel表格、PPT幻燈片)和調用API,甚至接入Google Drive、GitHub等外部數據;
4、圖像生成API補足基礎的可視化內容生成,可以為報告或幻燈片創建視覺素材。
這套“工具箱”搭載在壹個虛擬機環境下,由經過強化學習訓練的模型調度,能實現從自動檢索、分析、生成文檔,到最終下單、預約的完整閉環。
在發布演示中,OpenAI選擇了壹個貼近生活的案例:用Agent幫用戶策劃壹場婚禮行程。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見