-
日期: 2025-11-18 | 來源: 騰訊科技 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大

當地時間11月18日,Alphabet旗下的谷歌正式推出Gemini 3系列模型。Gemini 3 Pro已於即日起在Gemini應用、Search AI Mode、AI Studio、Vertex AI以及全新代理式開發平台Google Antigravity中開放預覽。
性能全面躍升:多項前沿基准測試奪冠
谷歌表示,Gemini 3 Pro在推理與多模態能力上實現了“前所未有的深度與細膩度”,並在幾乎所有主流AI基准上全面超越前代2.5 Pro。它以1501 Elo(Elo評分體系,用於衡量模型在盲測對戰中的相對實力)的突破性成績登頂LMArena榜單,在“人類終極考試”(Humanity’s Last Exam)中取得37.5%(無工具)成績,並在高難度科學推理測試GPQA Diamond中拿下91.9%的頂級表現。
在數學方面,Gemini 3 Pro再次刷新前沿模型記錄,以23.4%的成績奪得MathArena Apex新高,顯示出其在結構化邏輯思維與復雜計算上的強勢提升。
作為壹款完全多模態的基礎模型,Gemini 3 Pro在視覺和視頻理解同樣創下新紀錄:多模態大考MMMU-Pro得分81%,視頻推理基准Video-MMMU得分87.6%,均創當前SOTA。在強調事實壹致性的SimpleQA Verified中,它也以72.1%的成績領先同類模型。
谷歌稱,這些能力意味著Gemini 3 Pro可以在科學、數學、工程等高復雜度任務中提供更可靠的分析與建議,並在日常交互中給出“更直接、更有洞察力”的回應。
除了在多項基准測試中刷新紀錄外,Gemini 3 Pro也為每壹次交互帶來了全新的深度與細膩度。谷歌表示,新模型的回答更加聰明、簡潔且直截了當,避免陳詞濫調和無謂的恭維,更傾向於提供具有洞見的結論與判斷——“告訴你需要知道的,而不是你想聽的”。
這壹代模型更像壹個真正的思考伙伴。它能夠幫助用戶以全新的方式理解信息和表達觀點,例如將晦澀難懂的科學概念轉譯為高保真的可視化代碼,或在創作、規劃等場景中進行更具啟發性的頭腦風暴。谷歌強調,這種“深度交互體驗”是Gemini 3 Pro在推理與多模態能力躍升後的自然結果,使其在專業分析與日常創意任務中都表現得更加可靠而富有洞察力。
Gemini 3 Deep Think:推理能力進壹步躍升
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見