-
日期: 2025-12-12 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小 中 大
北京時間12月12日凌晨,OpenAI把發布的GPT-5.2定義為“迄今為止功能最強大的專業知識工作模型系列”。
OpenAI給出的官方文檔明確指出,GPT-5.2 的設計初衷在於“創造更大的經濟價值”。相較前代,它在電子表格處理、演示文稿制作、代碼編寫、圖像感知、長文本理解及復雜多步項目執行等方面,均實現了全面性能躍升。
為了驗證其在真實業務環境中的價值,OpenAI引入了GDPval基准測試,該測試覆蓋了9大行業、44類職業的1320個真實業務場景。官方數據顯示,GPT-5.2 Pro在高達74.1%的任務中表現超越或持平人類專家。
多家早期合作企業,如Notion、Databricks和Cognition,也從測試中觀察到模型在長鏈條推理、數據分析和代碼審查等任務中的錯誤率顯著下降,壹致性與穩定性得到明顯改善,使其更適合作為“公司級智能體”的核心引擎。
就在壹周多前,奧特曼在給員工的私人信息中宣布進入“紅色警戒”狀態,調集更多資源投入 ChatGPT。行業對於GPT-5.2的預期為,硬剛Gemini 3,奪回SOTA。但是,這次GPT-5.2的發布,並沒有看出“應戰”的火藥味和心虛的“不服感”。
Gemini 3 被 Google 定義為“新壹代智能時代的起點”,核心是多模態推理 + 代理能力 + 搜索和 Workspace 場景的深度融合。而GPT-5.2清晰明確指向專業知識場景,強調“經濟價值”,定位區別清晰。
GPT-5.2的官方說明文檔讀下來,整體感覺是,有點無聊,但OpenAI更有商業戰略定力了。
OpenAI應用業務首席執行官菲吉·西莫(Fidji Simo)在新聞發布會上也表示:“我們宣布了‘紅色警報’,旨在向公司發出明確信號,即我們希望將資源集中在壹個特定領域,這也是界定公司優先事項的壹種方式。”
西莫同時否認了GPT-5.2系列模型的發布是受“紅色警報”行動影響而匆忙提前的,她強調,公司為這款新模型的發布已經進行了數月的准備工作。
在經歷了數月准備後推出的GPT-5.2,核心看點完全圍繞著“創造更大的經濟價值“展開:
●叁級模型矩陣: 推出 Instant(極速)、Thinking(深度思考)、Pro(最強解難) 叁個版本,以滿足從日常輕量對話到復雜科研的不同需求。
●“打工人”實戰能力質變: 基於全新的 GDPval 基准,GPT-5.2 Pro 在 74.1% 的真實職業任務(如投行建模、PPT制作)中勝過或持平人類專家,效率提升 11 倍,標志著從“對話”轉向“交付”。注:GDPval主要通過直接測試模型在各行各業真實工作任務中的表現來衡量其性能,覆蓋美國GDP前九大產業中的44個關鍵職業領域,從軟件開發、法律到醫療護理和機械工程,涵蓋了對經濟至關重要的專業場景。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見