-
日期: 2025-12-13 | 來源: 新智元 | 有0人參與評論 | 字體: 小 中 大
GPT-5.2打贏Gemini 3.0 Pro,竟是靠高推理與海量Token“作弊”?網友的這個發現,在AI社區壹石激起千層浪。更多網友柒嘴八舌表示:GPT-5.2,並沒有那麼好用!
太戲劇了。
OpenAI昨天剛放出大殺器GPT-5.2,今天就被曝疑似虛假營銷?
凌晨的科技圈,被壹則爆料點燃——
壹位用戶通過精細計算發現了“華點”:OpenAI在最新發布的基准測試中,可能通過調整模型“推理力度”參數,讓GPT-5.2在關鍵評測中使用了遠超對手的算力資源。
壹句話總結就是:在調整token使用後,GPT-5.2和Gemini 3 Pro在ARC AGI 2上的表現基本相當。
具體來說,問題就出在這幾張圖上。
可以看到,OpenAI在基准測試中使用了額外的token,至少是Gemini 3.0 Pro的兩倍。
這就像兩個棋手對弈,壹方被允許思考壹個小時,另壹方卻只有拾分鍾,然後宣布前者獲勝。

在這種情況下,結果還公平嗎?
OpenAI勝過谷歌,其實靠作弊?
昨天的AI圈,都被GPT-5.2吊打Gemini 3.0 Pro的結論所震撼,而前者在ARC AGI 2的精彩表現,則尤為出圈,被AI社區大加贊賞。
但現在,這些結果很可能注了水?
比如在備受關注的ARC AGI 2測試中,GPT-5.2 xhigh版得分52.9%,每個任務消耗約13.5萬個token。
按API定價計算,每個任務僅算力成本就高達1.9美元。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見