谷歌 Gemini 3 深夜炸場:沒有懸念的最強 AI

日期: 2025-11-20 | 來源: Li Yuan | 有0人參與評論 | 專欄: 谷歌 | 字體: 小中大
來了。

預熱了快壹個月的 Gemini 3 Pro，就在剛剛，正式在 Google AI Studio 上線 Preview 版，API 也同步開放。接下來將陸續上線Google的各項產品中。

沒有任何多余的廢話，打開 Model Card，滿眼寫著的只有兩個字：碾壓。

按照 Google 披露的測試數據，Gemini 3 Pro 毫無懸念地成為了目前地球上數學最強的 AI。在數學競賽的“地獄模式”MathArena 裡，當包括 GPT-5.1 在內的其他大模型還在 1% 上下掙扎時，Gemini 3 Pro 直接幹到了23.4%。

編程能力方面，雖然在 SWE-Bench 上未拿 SOTA——但絕對屬於第壹梯隊。Live Code Bench 的 Elo 得分超過 2400 分，在工具調用和終端操作基准測試中更是名列第壹。

真正炸裂的是它的“視覺智能”。

對屏幕截圖的理解能力高達72.7%，是目前最先進水平的兩倍。這意味著 Agent 不再是瞎子，它將徹底重塑 AI 操作計算機的模式。

但這還沒完，Google 今晚還順手扔出了壹個小王炸：自家的 Agentic 編程平台——Google Antigravity。

此前網傳 Gemini 3 能實現“端到端編程”，大家以為是模型成精了。但看起來，並不是模型成精，而是 Google 正在探索如何用更好的系統工程實現端到端編程。

如果說 Cursor 是目前最強的“外骨骼”，它通過 AI 補全讓你寫代碼更快；那 Antigravity 就是奔著“自動駕駛”去的。它不再只是壹個編輯器，而是壹個智能體優先（Agent-first）發環境。集成了 Gemini 3 和能操控瀏覽器的 Gemini 2.5 Computer Use 模型，它的 Agent 能自己寫代碼、自己開終端跑測試、甚至自己打開瀏覽器驗證 UI，發現報錯自己修。

不講故事，只拼肌肉。

Google 用這壹波硬核發布宣告：新王已至。

有趣的是，這次連 Sam Altman 都獻上了自己的點贊。：）

01 霸榜的暴力美學：不止是智商洗榜，更是 Agent 能力的變化

在 AI 圈子裡，大家習慣了模型之間你追我趕的微弱優勢，但 Gemini 3 Pro 拋出的這份成績單，可以說拾分耀眼。

根據 Model Card 披露的數據，Gemini 3 Pro 在推理、多模態、Agent 工具使用等關鍵基准上，實現了全方位的霸榜。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 5 下壹頁

在此頁中閱讀全文
更多谷歌的新聞

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞