GPT-5.2被曝作弊!不如Gemini 3(圖

日期: 2025-12-13 | 來源: 新智元 | 有0人參與評論 | 字體: 小中大
GPT-5.2打贏Gemini 3.0 Pro，竟是靠高推理與海量Token“作弊”？網友的這個發現，在AI社區壹石激起千層浪。更多網友柒嘴八舌表示：GPT-5.2，並沒有那麼好用！

太戲劇了。

OpenAI昨天剛放出大殺器GPT-5.2，今天就被曝疑似虛假營銷？

凌晨的科技圈，被壹則爆料點燃——

壹位用戶通過精細計算發現了“華點”：OpenAI在最新發布的基准測試中，可能通過調整模型“推理力度”參數，讓GPT-5.2在關鍵評測中使用了遠超對手的算力資源。

壹句話總結就是：在調整token使用後，GPT-5.2和Gemini 3 Pro在ARC AGI 2上的表現基本相當。

具體來說，問題就出在這幾張圖上。

可以看到，OpenAI在基准測試中使用了額外的token，至少是Gemini 3.0 Pro的兩倍。

這就像兩個棋手對弈，壹方被允許思考壹個小時，另壹方卻只有拾分鍾，然後宣布前者獲勝。

在這種情況下，結果還公平嗎？

OpenAI勝過谷歌，其實靠作弊？

昨天的AI圈，都被GPT-5.2吊打Gemini 3.0 Pro的結論所震撼，而前者在ARC AGI 2的精彩表現，則尤為出圈，被AI社區大加贊賞。

但現在，這些結果很可能注了水？

比如在備受關注的ARC AGI 2測試中，GPT-5.2 xhigh版得分52.9%，每個任務消耗約13.5萬個token。

按API定價計算，每個任務僅算力成本就高達1.9美元。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 ...7 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞