壹文讀懂GPT-5發布會:價格屠夫、編程驚艷

日期: 2025-08-07 | 來源: AI未來指北 | 有0人參與評論 | 字體: 小中大
北京時間8月8日凌晨1點的發布會上，GPT-5 總算在萬眾期待中姍姍而至，此時，距離GPT-4的發布已過去了兩年半。

但這壹次，比起ChatGPT 的驚艷亮相、GPT-4 的跨越式升級、o1 發布時的震撼全場，這場發布會顯得格外平淡：不太驚艷的Benchmark，毫無新范式的影子；很難激起興趣以及看出與競品區別的用例展示；甚至還有被網友抓包的PPT展示錯誤，共同構成了這1小時20分鍾的發布會。

但這並不意味著GPT-5沒有進步。極低的幻覺率、前端能力的加強、上下文能力的躍升和極為有競爭力的價格，都是這次難得的亮點。

尤其是價格，在GPT-5精彩的編程表現之下，其API價格僅為昨天發布的Claude Opus 4.1的1/15，也比Gemini 2.5 Pro價格低。

這可以說是對Anthropic的致命壹擊。

今晚的OpenAI，雖失去了魔法的節奏、但依然在和其他廠商的肉搏中站穩了腳跟。

GPT-5本體：有限的升級、微末的SOTA

本次GPT-5共有4個版本，分為GPT-5 、 GPT-5 mini、 GPT-5 nano，以及只對企業版和每月 200 美元高級版開放的GPT-5 Pro模式。

對於壹般用戶而言，默認的是統壹模型GPT-5，它是由多個模型組成的系統，包括用於大多數問題的“智能且快速”模型（ gpt-5-main ）和用於更復雜問題的“更深層推理”模型（ gpt-5-thinking ）。

這種統壹的實現，是由壹個實時路由器決定針對特定查詢使用哪個模型。

mini、nano的具體選擇則是API用戶可選。而GPT-5Pro模式，則類似於Grok 4 Hard模式，使用了並行測試計算，壹次多個模型壹起並行計算更長時間。它用更大的算力，提供了最全面、最精准的答案。在超高難度的科學問題（GPQA）上，它刷新了世界紀錄。在與人類專家的「盲測」中，10 次裡有近 7 次被認為更優。

而在能力和評分上，GPT-5 幾乎在每壹項上都有提升，但都只比當下SOTA高了壹點點，也只比o3強得很有限。

智力水平：體驗最佳，但不是智力最佳

在智力的水平，各種主流評測集裡，GPT-5都高於o3水平，但整體差距沒有非常大。

細拆下來，其中提升最明顯的前沿數學測試集裡，我們能看到，GPT-5的效果還不如ChatGPT Agent，只有使用Pro模式下才會更強。

當與其他模型做比較時，我們就能發現，GPT-5大多數“智力”能力僅僅稍微高出競爭對手壹點，部分能力甚至還並非SOTA，只能說整體以微小幅度領先。很難說是什麼跨越式的能力提升。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 ...10 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞