GPT-5.2降智遭全网差评!奥特曼慌了 | 新闻 | 手机版本

GPT-5.2降智遭全网差评!奥特曼慌了

日期: 2025-12-14 | 来源: 新智元 | 有0人参与评论 | 字体: 小中大
在文本能力指数测试中，Gemini 3 Pro只在ARC-AGI-2中落后，GPT-5.2几乎全线溃败！

在视觉能力指数测试中，Gemini 3 Pro再次几乎全胜，比GPT-5.2平均得分高出了4.5分！

在风险指数测试中，GPT-5.2领先Gemini 3 Pro，但落后于Claude Opus 4.5和Claude Sonnet 4.5.

在评估语言模型在终端环境中驱动自主智能体能力的测试平台Terminus上，Gemini 3.0 Pro和GPT-5.2几乎不分上下，但Gemini 3.0 Pro与GPT-5.2的高推理模式相比，仍平均多了0.2%。

此外，网友也验证其他基准测试，比如SWE-Bench、IUMB：
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

上一页 1 ...3 4 567 8 下一页

在此页中阅读全文

我们的赞助商

评论

目前还没有人发表评论, 大家都在期待您的高见

发表评论

相关功能

新闻