能连干30多个小时,史上最卷AI诞生

日期: 2025-09-30 | 来源: 爱范儿 | 有0人参与评论 | 字体: 小中大
论卷编程，还得看 Claude。

就在刚刚，Anthropic 正式发布 Claude Sonnet 4.5。

先说 Claude Sonnet 4.5 交出的成绩单，在考察真实编程水平的 SWE-bench Verified 测试里，Claude Sonnet 4.5 直接登顶业界第一。

更离谱的是，它能连续专注干活超过 30 小时。

好好好，AI 取代人类的优势又 +1 了。

比如让它写个类似 Slack 或 Teams 的聊天应用，它能一口气敲出大约 1.1 万行代码。相比之下，之前的 Claude Opus 4 和 Codex，最多也就能独立工作七小时。

用 Anthropic 的话来说，Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学，各项能力都狠狠提升了一波。

比方说，在 OSWorld 这个专门测试真实计算机任务的基准里，它拿下了 61.4% 的成绩，直接第一。要知道，四个月前 Sonnet 4 还以 42.2% 的成绩遥遥领先，这才多久性能就又往上抬了一大截。

而 Anthropic 的 Claude Chrome 插件甚至能直接在浏览器里自己导航网站、填表格、处理任务，像个真人在操作似的。推理、金融这些测评项目上也都更强了，各项指标都在往上涨。

有了这么强的能力，Anthropic 这次自然不会只发个模型就完事。

具体来看：

Claude Code加了“检查点”功能，能随时保存进度，想回退到之前某个状态一键搞定

终端界面翻新，还发布了原生 VS Code 插件

Claude API 增加了上下文编辑功能和记忆工具
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

在此页中阅读全文

我们的赞助商

目前还没有人发表评论, 大家都在期待您的高见

发表评论