OpenAI急了:Anthropic正用AI編程把它拉下神壇

日期: 2026-03-12 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小中大
布羅克曼有壹個自己設計的測試方法，叫“反向圖靈測試”。他多年前親自編寫了這套程序，規則是這樣的：兩台電腦前各坐壹個人，每人屏幕上有兩個聊天窗口，壹個連接著對面的人，壹個連接著AI。目標是判斷哪個窗口是AI，同時還得讓對方以為你才是AI。

去年大部分時間，OpenAI最好的模型要完成這個游戲的代碼編寫，需要好幾個小時，中間還得有人壹步步引導。到12月，Codex用GPT-5.2做引擎，壹個結構清晰的提示詞輸入後，就能直接生成壹個可運行的游戲。

感受到變化的不僅僅是布羅克曼。開發者社區裡開始頻繁討論AI編程智能體的能力提升，話題從硅谷擴散到更廣的范圍。壹些沒有編程背景的人，也開始嘗試用這些工具做些簡單的軟件項目。

Anthropic和OpenAI都在爭搶用戶。有開發者表示，自己每月支付200美元的Codex或Claude Code訂閱費，實際能用到價值1000多美元的服務。兩家公司都在用慷慨的用量限制把用戶往工作流裡引導，等人用習慣了，再按實際用量收費。

從數據上看，OpenAI確實在縮小差距。

2025年9月，Codex的使用量大約是Claude Code的5%。到2026年1月，這個比例上升到接近40%。

Notion的聯合創始人西蒙·拉斯特（Simon Last）說，他和團隊在GPT-5.2發布後從Claude Code切換到了Codex，主要原因是後者更穩定。“我發現Claude Code有時候會給出不准確的信息，”他說，“它說自己正在處理任務，實際上並沒有進展。”

在OpenAI負責Codex行為研究的凱蒂·施（Katy Shi）說，有些用戶覺得Codex的回應風格偏“幹”，但越來越多人開始接受這種不刻意迎合的特點。“工程領域的工作，本來就需要能夠接受批評性反饋，不能因為表達方式直接就覺得被冒犯。”

企業客戶也在逐步進入。OpenAI應用部門的CEO菲吉·西莫（Fidji Simo）稱：“ChatGPT已經成為AI領域的代表性產品，這在B2B市場是壹個明顯優勢，多數企業傾向於使用員工已經熟悉的技術。”OpenAI銷售Codex的策略，主要是將其打包進ChatGPT的企業套件中壹並提供。

思科的總裁傑圖·帕特爾（Jeetu Patel）告訴員工，不用太在意使用Codex產生的費用，關鍵是要熟悉這個工具。有員工問他用了之後會不會失業，他的回答是：“不會，但不用壹定會失業。不熟悉這些工具的人，慢慢會失去競爭力。”

有開發者認為，OpenAI在B端市場的渠道優勢正在發揮作用。不少公司已經采購了ChatGPT的企業版，在此基礎上增加壹個Codex功能，決策成本並不高。

也有分析指出，Codex最近的能力提升與GPT-5.2的推理能力優化直接相關。o系列模型采用的訓練方法，即讓模型在結果可驗證的編程任務中不斷試錯、獲得反饋，這對代碼生成的質量有明顯幫助。編程本身就是壹個反饋信號明確的領域，代碼要麼能運行要麼不能，這種特性對模型迭代很有利。

05 奧特曼的難題：既要速度，又怕失控

AI編程智能體的影響已經不限於開發者社區。

《華爾街日報》上個月將科技股1萬億美元的拋售部分歸因於Claude Code，因為投資者擔心軟件本身的價值可能被壓縮。之後Anthropic宣布，Claude Code可以對IBM那些運行COBOL語言的老系統進行現代化改造，IBM的股票遭遇了25年來最大單日跌幅。

OpenAI也在加大投入。今年的超級碗廣告，他們投放的是Codex，而不是ChatGPT。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁 1 2 345 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞