-
日期: 2025-12-14 | 来源: 新智元 | 有0人参与评论 | 字体: 小 中 大
在文本能力指数测试中,Gemini 3 Pro只在ARC-AGI-2中落后,GPT-5.2几乎全线溃败!
在视觉能力指数测试中,Gemini 3 Pro再次几乎全胜,比GPT-5.2平均得分高出了4.5分!
在风险指数测试中,GPT-5.2领先Gemini 3 Pro,但落后于Claude Opus 4.5和Claude Sonnet 4.5.
在评估语言模型在终端环境中驱动自主智能体能力的测试平台Terminus上,Gemini 3.0 Pro和GPT-5.2几乎不分上下,但Gemini 3.0 Pro与GPT-5.2的高推理模式相比,仍平均多了0.2%。
此外,网友也验证其他基准测试,比如SWE-Bench、IUMB:- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见