-
日期: 2026-03-29 | 來源: 牛彈琴 | 有0人參與評論 | 專欄: 馬斯克 | 字體: 小 中 大
AI競爭這件事上,攻守之勢正在發生變化。
也許很多年後,人們才會意識到,轉折點,只是當時的壹件“小事”。
(壹)
這幾天,壹場堪稱“AI世紀打假”的戲碼在全球科技圈上演。
硅谷當紅炸子雞AI編程巨頭Cursor,高調發布其“自研”的Composer 2模型。然而,全球開發者卻在代碼中抓到了致命問題——模型ID赫然顯示為中國產大模型Kimi K2.5。
壹家正在尋求500億美元估值的硅谷明星企業,其最核心的競爭力,竟然必須悄悄建立在壹個來自中國的基礎模型之上——而且,開發這個模型的公司估值僅有180億美元。
這簡直滑天下之大稽,壹時間,全網AI從業者嘩然。
更有意思的事,開發者這個模型的中國公司,4天前剛剛才給了硅谷技術圈壹個小小的震撼。到底是咋回事?還得從技術底層聊起:
這兩年讓AI技術深入生活的,大部分是“大模型”產品,普通人能跟AI直接對話,讓它幫忙工作、做視頻、出主意,都是因為它能進行“邏輯推演”,這背後,源自它名為Transformer的核心組件,這個核心組件的底層,則用了壹種叫“殘差連接”的主要邏輯。
這個殘值連接不得了,它堪稱現代大模型的基石,不管是長文本理解、復雜邏輯推理,還是多輪對話,模型都靠它保證深層網絡的穩定訓練和信息傳遞。
但是,這種連接還是不完善的,用久了,大家就發現了壹個核心痛點——層數越深,殘差裡的有效信息越容易被稀釋,早期層的關鍵信息直接被埋住。
這是阻礙大模型的能力進壹步變強的絆腳石之壹。
而就在3月16日,中國大模型廠商月之暗面,也就是發布了Kimi的公司,發布了壹份名為《注意力殘差》的技術報告,從底層邏輯的層面,對Transformer架構的關鍵組件殘差連接進行了其發布拾年來的首次重大重構。
簡單來說,就是Kimi為大模型這整個“物種”的基礎架構層,提出了壹套新的思考路徑,讓其找到全新的進化空間。
這壹成果,讓馬斯克關注到了,並評價為“印象深刻”。緊接著,就有開發者發現壹個問題:
這個中國模型的名字怎麼有點眼熟?它似乎出現在硅谷自研的前沿模型 Composer 2的底層代碼裡。
馬斯克確認了這件事,並在社媒上轉發,壹錘定音,輿論嘩然後,“冒用者”Cursor也坐不住了,其聯合創始人Aman Sanger發表聲明“服軟”:
“我們系統評估了眾多開源基座模型,Kimi k2.5被證明是世界最強的。”
這毫無疑問是揭開了壹塊“遮羞布”:
硅谷公司引以為傲的技術創新大廈,其地基正在被悄然置換為中國制造。
(贰)
硅谷可不是僅僅是壹個地名,它幾乎是全世界頂尖人工智能人才向往的聖地,是美國在AI競爭中最不可替代的基石。它的品牌,是幾代精英,用幾拾年來鑄造的。
硅谷何以為硅谷?這背後有兩個關鍵“定量”:
第壹,必須始終保持創新,保持對全世界的技術優勢,甚至讓這裡的思想,成為引領全世界技術進化的方向;
第贰,必須能夠輸出標准,這裡不僅僅是科技領域的技術標准,還包括了很多產業范式,比如AI領域壹貫堅持的“開源協作”。
但是,當馬斯克撕開了遮羞布,這兩大基石就產生動搖了。“還能相信硅谷嗎?”有人在社交媒體上反問。
懷疑的種子壹旦種下,命運的齒輪也就開始轉動了。越來越多的人發現,不能只關注硅谷故事,還應該多看看中國成果。
這壹看不要緊,原來,除了硅谷的初創公司開始拋棄昂貴的專有模型,轉向開源的中國版本之外,從Airbnb到德國工業巨頭西門子,已公開使用中國模型。
市場在用腳投票,資本也沒閒著。
以這次事件的主角Kimi為例——它在3個月內估值翻4倍至180億美元,增速超過了同期的字節和拼多多。
正如全球最大AI社區Hugging Face聯合創始人直言:- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見