-
日期: 2025-11-20 | 來源: Li Yuan | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
來了。
預熱了快壹個月的 Gemini 3 Pro,就在剛剛,正式在 Google AI Studio 上線 Preview 版,API 也同步開放。接下來將陸續上線Google的各項產品中。
沒有任何多余的廢話,打開 Model Card,滿眼寫著的只有兩個字:碾壓。
按照 Google 披露的測試數據,Gemini 3 Pro 毫無懸念地成為了目前地球上數學最強的 AI。在數學競賽的“地獄模式”MathArena 裡,當包括 GPT-5.1 在內的其他大模型還在 1% 上下掙扎時,Gemini 3 Pro 直接幹到了23.4%。
編程能力方面,雖然在 SWE-Bench 上未拿 SOTA——但絕對屬於第壹梯隊。Live Code Bench 的 Elo 得分超過 2400 分 ,在工具調用和終端操作基准測試中更是名列第壹。
真正炸裂的是它的“視覺智能”。
對屏幕截圖的理解能力高達72.7%,是目前最先進水平的兩倍。這意味著 Agent 不再是瞎子,它將徹底重塑 AI 操作計算機的模式。
但這還沒完,Google 今晚還順手扔出了壹個小王炸:自家的 Agentic 編程平台——Google Antigravity。
此前網傳 Gemini 3 能實現“端到端編程”,大家以為是模型成精了。但看起來,並不是模型成精,而是 Google 正在探索如何用更好的系統工程實現端到端編程。
如果說 Cursor 是目前最強的“外骨骼”,它通過 AI 補全讓你寫代碼更快;那 Antigravity 就是奔著“自動駕駛”去的。它不再只是壹個編輯器,而是壹個智能體優先(Agent-first)發環境。集成了 Gemini 3 和能操控瀏覽器的 Gemini 2.5 Computer Use 模型,它的 Agent 能自己寫代碼、自己開終端跑測試、甚至自己打開瀏覽器驗證 UI,發現報錯自己修。
不講故事,只拼肌肉。
Google 用這壹波硬核發布宣告:新王已至。
有趣的是,這次連 Sam Altman 都獻上了自己的點贊。:)
01 霸榜的暴力美學:不止是智商洗榜,更是 Agent 能力的變化
在 AI 圈子裡,大家習慣了模型之間你追我趕的微弱優勢,但 Gemini 3 Pro 拋出的這份成績單,可以說拾分耀眼。
根據 Model Card 披露的數據,Gemini 3 Pro 在推理、多模態、Agent 工具使用等關鍵基准上,實現了全方位的霸榜。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見