-
日期: 2025-02-02 | 來源: 自由財經 | 有0人參與評論 | 專欄: 特朗普 | 字體: 小 中 大
中國新創DeepSeek(深度求索)近期發表AI模型,引發全球關注,DeepSeek的團隊聲稱,相較於美國競爭對手推出的AI助理使用更少的成本和資料,卻能達到可以媲美美國競爭對手的性能,這款AI模型的表現令美國投資人和企業高層感到震驚,連帶市場出現劇烈波動。
DeepSeek是中國AI新創公司,該公司研發的AI模型R1在今年1月下旬正式發布,DeepSeek聲稱這款突破性模型的訓練成本不到600萬美元,且性能比肩OpenAI、Google和Meta等巨頭推出的模型,考慮到ChatGPT訓練成本超過1億美元,DeepSeek的成本低的驚人。
DeepSeek的竄起備受矚目,旗下推出的應用程式1月27日登上蘋果(Apple)App Store的排行榜冠軍,下載量將近200萬,超越ChatGPT,這是Gemini、Claude等其他AI模型所無法達到。
橫空出世造成1/27科技股重挫
DeepSeek橫空出世嚇壞全球市場,由於亞洲主要市場中、台、韓股正逢新年假期休市,日本科技股成為亞股重災區27日壹片慘綠,包括輝達的半導體測試設備供應商愛德萬測試(Advantest Corporation)重挫8.61%、軟銀(Softbank)跌8.32%、東京威力科創(Tokyo Electron)跌4.9%、迪斯科(Disco)跌3.3%。
美國科技股同(27)日也重挫,包括輝達在內的芯片股壹路狂瀉,當天收盤輝達跌近17%、博通(Broadcom)跌17.4%、台積電ADR收盤跌13.33%、超微(AMD)則跌逾6%。輝達單日市值蒸發5926.58億美元,改寫史上最大跌幅,這壹數字是2024年9月股災時,市值蒸發2790億美元的兩倍多。
不過對於市場擔心DeepSeek使用更少的芯片,將影響未來AI芯片的需求,輝達認為,中國AI新創的進步表明,輝達芯片確實有用,未來將需要更多芯片來滿足需求;微軟(Microsoft)執行長納德拉(Satya Nadella)則以焦耳斯悖論(Jevons paradox)再度出現為例,強調隨著AI工具更有效率且更易取得,需求反會加速膨脹。
OpenAI的地位及成本遭質疑
DeepSeek表示,旗下的2款AI模型V3和R1性能可以比擬OpenAI和Meta的語言模型,R1的成本比OpenAI o1便宜20到50倍。DeepSeek以低成本完成AI模型,對於在AI資本支出砸重金的美國企業而言,成了壹大打擊。
Counterpoint Research的AI分析師孫偉表示,DeepSeek證明,可以透過有限的運算資源來研發尖端AI模型。相較之下,花費1570億美元的OpenAI,無法證明自己能在在創新過程中保持優勢,同時巨額支出並未帶來可觀的回報。
不過,DeepSeek是否真的花費不到600萬美元的成本就研發出AI模型,這壹說法的可性度也令人存疑。投資公司Atreides Management合伙人兼資訊長貝克(Gavin Baker)認為,600萬美元實際上不包括與架構、運算和資料有關的研究以及消融實驗的成本。並稱,如果壹個實驗室已經花費了數億美元進行研究,並可以使用更大的叢集,那當然可以用600萬美元建造出與R1同樣品質的模型。
恐利用“蒸餾”技術打造自家模型
不少技術人員也認為,DeepSeek的模型可能“參考”美國AI模型,利用“蒸餾(distillation)”技術打造自家模型,透過使用更成熟、功能強大的AI模型,來評估新模型給出的答案品質,這也代表新模型可以省下構建初始模型所需的大量時間及運算能力,無需承擔相關成本。
川普政府的AI沙皇薩克斯(David Sacks)近日接受《福克斯新聞》訪問時指出,DeepSeek使用了壹種名為“蒸餾”的過程,借由壹個新的AI模型向壹個現有模型提出數百萬個問題,以便學習其知識並模仿其推理過程,有充分的證據表明,DeepSeek所做的就是從OpenAI的模型中獲取知識。
隨後就有知情人士向《彭博》透露,微軟和OpenAI正在調查DeepSeek是否竊取資料,並稱,微軟的安全研究人員去年秋天就觀察到,他們認為DeepSeek的相關組織可能使用 OpenAI 應用程式介面 (API) 竊取了大量資料。
OpenAI則向《金融時報》證實,已掌握DeepSeek盜用模型證據。根據OpenAI的服務條款,用戶不得“復制”任何OpenAI的服務,或是“利用輸出結果,來開發與OpenAI競爭的模型”。
川普恐全面限制輝達芯片輸中
面對DeepSeek帶來的威脅,美國總統川普表示,這將敲響美國產業的“警鍾”,讓產業意識到,美國需要更加專注於競爭並取得勝利。但川普也補充,能夠推出更便宜、更快的AI模型是壹件好事,這代表產業將不用花這麼多的成本,也能得到同樣的結果。
華府智庫戰略與國際研究中心(CSIS)瓦德瓦尼AI和先進技術中心主任艾倫(Gregory Allen)指出,技術創新是真的,但發表的時機點在本質上具有政治性考量。艾倫補充,DeepSeek公布AI模型,試圖證明美國的出口管制“徒勞無功”或只會“適得其反”,這才是中國外交政策的真正目標。
各界開始采取行動應對,白宮聲明表示,美國國家安全會議(NSC)正在檢視該程式對國家安全的影響,也將致力於確保美國在AI領域的主導地位。美國海軍則開出第1槍,以“這款模型起源和使用相關潛在安全和道德問題”為由,要求全體人員避免使用該公司出品的任何模型,意大利、美國會也跟上,封殺DeepSeek。
市場則傳出,川普政府官員目前正在研究收緊輝達對中銷售限制的可能性,可能將管制進壹步擴大至輝達專門為中國市場設計的H20芯片。輝達的H20芯片可以用於研發和運行AI軟體、服務,是為了滿足美國的芯片出口限制,專門為中國設計的特供版芯片,運算能力僅約為H100芯片的5分之1。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見