-
日期: 2026-03-12 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小 中 大
布羅克曼有壹個自己設計的測試方法,叫“反向圖靈測試”。他多年前親自編寫了這套程序,規則是這樣的:兩台電腦前各坐壹個人,每人屏幕上有兩個聊天窗口,壹個連接著對面的人,壹個連接著AI。目標是判斷哪個窗口是AI,同時還得讓對方以為你才是AI。
去年大部分時間,OpenAI最好的模型要完成這個游戲的代碼編寫,需要好幾個小時,中間還得有人壹步步引導。到12月,Codex用GPT-5.2做引擎,壹個結構清晰的提示詞輸入後,就能直接生成壹個可運行的游戲。
感受到變化的不僅僅是布羅克曼。開發者社區裡開始頻繁討論AI編程智能體的能力提升,話題從硅谷擴散到更廣的范圍。壹些沒有編程背景的人,也開始嘗試用這些工具做些簡單的軟件項目。
Anthropic和OpenAI都在爭搶用戶。有開發者表示,自己每月支付200美元的Codex或Claude Code訂閱費,實際能用到價值1000多美元的服務。兩家公司都在用慷慨的用量限制把用戶往工作流裡引導,等人用習慣了,再按實際用量收費。
從數據上看,OpenAI確實在縮小差距。
2025年9月,Codex的使用量大約是Claude Code的5%。到2026年1月,這個比例上升到接近40%。
Notion的聯合創始人西蒙·拉斯特(Simon Last)說,他和團隊在GPT-5.2發布後從Claude Code切換到了Codex,主要原因是後者更穩定。“我發現Claude Code有時候會給出不准確的信息,”他說,“它說自己正在處理任務,實際上並沒有進展。”
在OpenAI負責Codex行為研究的凱蒂·施(Katy Shi)說,有些用戶覺得Codex的回應風格偏“幹”,但越來越多人開始接受這種不刻意迎合的特點。“工程領域的工作,本來就需要能夠接受批評性反饋,不能因為表達方式直接就覺得被冒犯。”
企業客戶也在逐步進入。OpenAI應用部門的CEO菲吉·西莫(Fidji Simo)稱:“ChatGPT已經成為AI領域的代表性產品,這在B2B市場是壹個明顯優勢,多數企業傾向於使用員工已經熟悉的技術。”OpenAI銷售Codex的策略,主要是將其打包進ChatGPT的企業套件中壹並提供。
思科的總裁傑圖·帕特爾(Jeetu Patel)告訴員工,不用太在意使用Codex產生的費用,關鍵是要熟悉這個工具。有員工問他用了之後會不會失業,他的回答是:“不會,但不用壹定會失業。不熟悉這些工具的人,慢慢會失去競爭力。”
有開發者認為,OpenAI在B端市場的渠道優勢正在發揮作用。不少公司已經采購了ChatGPT的企業版,在此基礎上增加壹個Codex功能,決策成本並不高。
也有分析指出,Codex最近的能力提升與GPT-5.2的推理能力優化直接相關。o系列模型采用的訓練方法,即讓模型在結果可驗證的編程任務中不斷試錯、獲得反饋,這對代碼生成的質量有明顯幫助。編程本身就是壹個反饋信號明確的領域,代碼要麼能運行要麼不能,這種特性對模型迭代很有利。
05 奧特曼的難題:既要速度,又怕失控
AI編程智能體的影響已經不限於開發者社區。
《華爾街日報》上個月將科技股1萬億美元的拋售部分歸因於Claude Code,因為投資者擔心軟件本身的價值可能被壓縮。之後Anthropic宣布,Claude Code可以對IBM那些運行COBOL語言的老系統進行現代化改造,IBM的股票遭遇了25年來最大單日跌幅。
OpenAI也在加大投入。今年的超級碗廣告,他們投放的是Codex,而不是ChatGPT。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見