-
日期: 2025-11-18 | 来源: 腾讯科技 | 有0人参与评论 | 专栏: 谷歌 | 字体: 小 中 大

当地时间11月18日,Alphabet旗下的谷歌正式推出Gemini 3系列模型。Gemini 3 Pro已于即日起在Gemini应用、Search AI Mode、AI Studio、Vertex AI以及全新代理式开发平台Google Antigravity中开放预览。
性能全面跃升:多项前沿基准测试夺冠
谷歌表示,Gemini 3 Pro在推理与多模态能力上实现了“前所未有的深度与细腻度”,并在几乎所有主流AI基准上全面超越前代2.5 Pro。它以1501 Elo(Elo评分体系,用于衡量模型在盲测对战中的相对实力)的突破性成绩登顶LMArena榜单,在“人类终极考试”(Humanity’s Last Exam)中取得37.5%(无工具)成绩,并在高难度科学推理测试GPQA Diamond中拿下91.9%的顶级表现。
在数学方面,Gemini 3 Pro再次刷新前沿模型记录,以23.4%的成绩夺得MathArena Apex新高,显示出其在结构化逻辑思维与复杂计算上的强势提升。
作为一款完全多模态的基础模型,Gemini 3 Pro在视觉和视频理解同样创下新纪录:多模态大考MMMU-Pro得分81%,视频推理基准Video-MMMU得分87.6%,均创当前SOTA。在强调事实一致性的SimpleQA Verified中,它也以72.1%的成绩领先同类模型。
谷歌称,这些能力意味着Gemini 3 Pro可以在科学、数学、工程等高复杂度任务中提供更可靠的分析与建议,并在日常交互中给出“更直接、更有洞察力”的回应。
除了在多项基准测试中刷新纪录外,Gemini 3 Pro也为每一次交互带来了全新的深度与细腻度。谷歌表示,新模型的回答更加聪明、简洁且直截了当,避免陈词滥调和无谓的恭维,更倾向于提供具有洞见的结论与判断——“告诉你需要知道的,而不是你想听的”。
这一代模型更像一个真正的思考伙伴。它能够帮助用户以全新的方式理解信息和表达观点,例如将晦涩难懂的科学概念转译为高保真的可视化代码,或在创作、规划等场景中进行更具启发性的头脑风暴。谷歌强调,这种“深度交互体验”是Gemini 3 Pro在推理与多模态能力跃升后的自然结果,使其在专业分析与日常创意任务中都表现得更加可靠而富有洞察力。
Gemini 3 Deep Think:推理能力进一步跃升
- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见