-
日期: 2025-08-07 | 來源: AI未來指北 | 有0人參與評論 | 字體: 小 中 大
北京時間8月8日凌晨1點的發布會上,GPT-5 總算在萬眾期待中姍姍而至,此時,距離GPT-4的發布已過去了兩年半。
但這壹次,比起ChatGPT 的驚艷亮相、GPT-4 的跨越式升級、o1 發布時的震撼全場,這場發布會顯得格外平淡:不太驚艷的Benchmark,毫無新范式的影子;很難激起興趣以及看出與競品區別的用例展示;甚至還有被網友抓包的PPT展示錯誤,共同構成了這1小時20分鍾的發布會。
但這並不意味著GPT-5沒有進步。極低的幻覺率、前端能力的加強、上下文能力的躍升和極為有競爭力的價格,都是這次難得的亮點。
尤其是價格,在GPT-5精彩的編程表現之下,其API價格僅為昨天發布的Claude Opus 4.1的1/15,也比Gemini 2.5 Pro價格低。
這可以說是對Anthropic的致命壹擊。
今晚的OpenAI,雖失去了魔法的節奏、但依然在和其他廠商的肉搏中站穩了腳跟。
GPT-5本體:有限的升級、微末的SOTA
本次GPT-5共有4個版本,分為GPT-5 、 GPT-5 mini、 GPT-5 nano,以及只對企業版和每月 200 美元高級版開放的GPT-5 Pro模式。
對於壹般用戶而言,默認的是統壹模型GPT-5,它是由多個模型組成的系統,包括用於大多數問題的“智能且快速”模型( gpt-5-main )和用於更復雜問題的“更深層推理”模型( gpt-5-thinking )。
這種統壹的實現,是由壹個實時路由器決定針對特定查詢使用哪個模型。
mini、nano的具體選擇則是API用戶可選。而GPT-5Pro模式,則類似於Grok 4 Hard模式,使用了並行測試計算,壹次多個模型壹起並行計算更長時間。它用更大的算力,提供了最全面、最精准的答案。在超高難度的科學問題(GPQA)上,它刷新了世界紀錄。在與人類專家的「盲測」中,10 次裡有近 7 次被認為更優。
而在能力和評分上,GPT-5 幾乎在每壹項上都有提升,但都只比當下SOTA高了壹點點,也只比o3強得很有限。
智力水平:體驗最佳,但不是智力最佳
在智力的水平,各種主流評測集裡,GPT-5都高於o3水平,但整體差距沒有非常大。
細拆下來,其中提升最明顯的前沿數學測試集裡,我們能看到,GPT-5的效果還不如ChatGPT Agent,只有使用Pro模式下才會更強。
當與其他模型做比較時,我們就能發現,GPT-5大多數“智力”能力僅僅稍微高出競爭對手壹點,部分能力甚至還並非SOTA,只能說整體以微小幅度領先。很難說是什麼跨越式的能力提升。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見