奇点真来了?史上首个"自我进化"AI诞生

日期: 2026-02-07 | 来源: 鲸选A | 有0人参与评论 | 字体: 小中大
OSWorld-Verified:64.7% 接近人类水平

这是一个测试 AI 在可视化桌面环境中完成生产力任务的基准——编辑电子表格、制作演示文稿、处理文档等。

GPT-5.3-Codex 得分 64.7%，而人类的平均水平是 72%。这意味着它在电脑操作任务上已经接近普通人的表现，比前代几乎翻了一倍。

最重要的一件事，官方一句话也震惊到了大家，“GPT-5.3 Codex 是我们第一个在创造自己的过程中发挥重要作用的模型。”OpenAI 直接说道，GPT-5.3-Codex 的早期版本被用来调试训练过程、管理部署管道、解释评估异常。“

AI 自我迭代自己，这不是营销话术。根据 OpenAI 内部披露，GPT-5.3-Codex 在开发过程中做了这些事：

分析训练日志，标记失败的测试

给训练脚本和配置文件提建议修复方案

生成部署配方

总结评估异常供人类审查

这意味着什么？AI 不再只是工具，它开始成为开发团队的一员，而且是能改进自己的那种。

不只是编程，GPT-5.3 要做的更多

理论数据很漂亮，但真正让人震撼的是开发者们分享的实际使用案例。

案例一：自主开发完整游戏

很多OpenAI用户展示了令人瞠目结舌的效果：让 GPT-5.3-Codex 自主开发款复杂的网页游戏，整个过程跨越数百万 tokens。

第一款是用户在大约20回合，消耗了33082个代币后，做出了一款像素游戏，作者称其差点从椅子上掉下来。

案例二：实时协作式开发

一位开发者在推特上分享：“现在用 GPT-5.3-Codex 写代码，就像跟一个真人结对编程。它会主动告诉我进度，我可以随时打断它、问问题、调整方向，而且它不会丢失上下文。”

这种“可引导”的特性是 GPT-5.3-Codex 的一大创新。以前的 AI 编程工具更像是“黑盒”，你给需求，它给代码，中间过程不透明。现在你可以在它工作时实时介入，就像真正的团队协作。citation

案例三：24 小时自主重构代码库

有开发者测试了 GPT-5.2-Codex（上一代）的“上下文压缩”功能，让它自主工作 24 小时以上，完成大规模代码重构和功能迁移，全程不需要人工干预。

而 GPT-5.3-Codex 在这个基础上速度提升了 25%，意味着原本需要一天的工作，现在 18 小时就能搞定。citation

更有意思的是，OpenAI 这次的定位变了。

以前的 Codex 就是写代码的工具，现在 GPT-5.3-Codex 的口号是：“支持软件生命周期的所有工作——调试、部署、监控、写 PRD、编辑文案、用户研究、测试、指标分析，甚至做幻灯片和表格。”

说白了，OpenAI 想让它成为“数字同事”，而不只是“代码生成器”。

而且，你可以在它工作时实时干预和引导，就像跟真人协作一样。OpenAI 还推出了 macOS 版 Codex 应用，专门用来同时管理多个 AI 代理。

传说中的 GPT-5.3 “Garlic”还在路上

更劲爆的是，网上已经开始流传 GPT-5.3 的完整版代号“Garlic”的泄露信息。

据说这个版本将会有：

超大上下文窗口：可能达到百万 tokens，能一次性加载整个代码库

原生工具集成：不需要外部插件就能调用各种开发工具

更高效率：缓存查询的 API 调用成本更低，让小团队也用得起

如果这些传闻属实，GPT-5.3 可能真的能做到：

一次性重构整个项目的主要功能

理解复杂的代码依赖关系

自动发现安全漏洞并提出修复方案
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

在此页中阅读全文

我们的赞助商

目前还没有人发表评论, 大家都在期待您的高见

发表评论