-
日期: 2025-08-07 | 來源: AI未來指北 | 有0人參與評論 | 字體: 小 中 大
而且與Gemini 這種大壹統模型不同,GPT-5仍然是壹個主要能進行文字和圖像理解的模型。當下,它仍然不支持音頻輸入/輸出和圖像生成,視頻就更別說了。
想短期內能追上剛發布的Genie 3,看起來對OpenAI來說還是太難了。
壹些驚喜:超低幻覺、上下文大躍進
雖然綜合實力並不驚艷,只能說勉強保住了第壹的位置。
但在壹些小的方面,GPT-5的提升確實非常可圈可點。而且這些小的方面,也許能起到決定性的作用。
首先是幻覺和安全。GPT-5顯著減少了幻覺的發生,它出現事實錯誤的概率比 GPT-4o 低約 45%,比 OpenAI o3 低約 80%。
這是個相當了不起的成就。僅有不到1%的幻覺率,這對於實際落地應用來講極其重要,在工業環境以及實際工作環境中,幻覺都是致命的。
所以,也難怪OpenAI的核心研究員Noam Brown把針對發布會的唯壹評論,獻給了GPT-5在消除幻覺上的進步。
GPT-5在System Card中簡要地提到了他們使用的大概方法。
他們壹方面強化訓練模型能夠有效地使用瀏覽工具來獲取最新的信息。另外,當模型不使用瀏覽工具,而是依賴其自身的內部知識時,訓練的重點是減少在這種情況下產生的幻覺。
更底層的原因,可能是GPT-5 thinking經歷的強化學習訓練。在這些訓練裡,OpenAI似乎利用了壹些最新的訓練方法,讓這些模型學會了“完善自己的思考過程,嘗試不同的策略,並認識到自己的錯誤”。
也正是因為這個訓練模式,GPT-5模型的“欺騙”行為也大幅減少,部分維度上居然可以減少近90%。(欺騙:在這裡指的是模型可能會向用戶謊報其行為,或者在任務無法完成、信息不足的情況下悄悄地不執行任務。這也和幻覺的下降直接相關。)
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見