-
日期: 2025-02-02 | 來源: 自由財經 | 有0人參與評論 | 專欄: 特朗普 | 字體: 小 中 大
中國新創DeepSeek(深度求索)近期發表AI模型,引發全球關注,DeepSeek的團隊聲稱,相較於美國競爭對手推出的AI助理使用更少的成本和資料,卻能達到可以媲美美國競爭對手的性能,這款AI模型的表現令美國投資人和企業高層感到震驚,連帶市場出現劇烈波動。
DeepSeek是中國AI新創公司,該公司研發的AI模型R1在今年1月下旬正式發布,DeepSeek聲稱這款突破性模型的訓練成本不到600萬美元,且性能比肩OpenAI、Google和Meta等巨頭推出的模型,考慮到ChatGPT訓練成本超過1億美元,DeepSeek的成本低的驚人。
DeepSeek的竄起備受矚目,旗下推出的應用程式1月27日登上蘋果(Apple)App Store的排行榜冠軍,下載量將近200萬,超越ChatGPT,這是Gemini、Claude等其他AI模型所無法達到。
橫空出世造成1/27科技股重挫
DeepSeek橫空出世嚇壞全球市場,由於亞洲主要市場中、台、韓股正逢新年假期休市,日本科技股成為亞股重災區27日壹片慘綠,包括輝達的半導體測試設備供應商愛德萬測試(Advantest Corporation)重挫8.61%、軟銀(Softbank)跌8.32%、東京威力科創(Tokyo Electron)跌4.9%、迪斯科(Disco)跌3.3%。
美國科技股同(27)日也重挫,包括輝達在內的芯片股壹路狂瀉,當天收盤輝達跌近17%、博通(Broadcom)跌17.4%、台積電ADR收盤跌13.33%、超微(AMD)則跌逾6%。輝達單日市值蒸發5926.58億美元,改寫史上最大跌幅,這壹數字是2024年9月股災時,市值蒸發2790億美元的兩倍多。
不過對於市場擔心DeepSeek使用更少的芯片,將影響未來AI芯片的需求,輝達認為,中國AI新創的進步表明,輝達芯片確實有用,未來將需要更多芯片來滿足需求;微軟(Microsoft)執行長納德拉(Satya Nadella)則以焦耳斯悖論(Jevons paradox)再度出現為例,強調隨著AI工具更有效率且更易取得,需求反會加速膨脹。
OpenAI的地位及成本遭質疑
DeepSeek表示,旗下的2款AI模型V3和R1性能可以比擬OpenAI和Meta的語言模型,R1的成本比OpenAI o1便宜20到50倍。DeepSeek以低成本完成AI模型,對於在AI資本支出砸重金的美國企業而言,成了壹大打擊。
Counterpoint Research的AI分析師孫偉表示,DeepSeek證明,可以透過有限的運算資源來研發尖端AI模型。相較之下,花費1570億美元的OpenAI,無法證明自己能在在創新過程中保持優勢,同時巨額支出並未帶來可觀的回報。
不過,DeepSeek是否真的花費不到600萬美元的成本就研發出AI模型,這壹說法的可性度也令人存疑。投資公司Atreides Management合伙人兼資訊長貝克(Gavin Baker)認為,600萬美元實際上不包括與架構、運算和資料有關的研究以及消融實驗的成本。並稱,如果壹個實驗室已經花費了數億美元進行研究,並可以使用更大的叢集,那當然可以用600萬美元建造出與R1同樣品質的模型。
恐利用“蒸餾”技術打造自家模型
不少技術人員也認為,DeepSeek的模型可能“參考”美國AI模型,利用“蒸餾(distillation)”技術打造自家模型,透過使用更成熟、功能強大的AI模型,來評估新模型給出的答案品質,這也代表新模型可以省下構建初始模型所需的大量時間及運算能力,無需承擔相關成本。
川普政府的AI沙皇薩克斯(David Sacks)近日接受《福克斯新聞》訪問時指出,DeepSeek使用了壹種名為“蒸餾”的過程,借由壹個新的AI模型向壹個現有模型提出數百萬個問題,以便學習其知識並模仿其推理過程,有充分的證據表明,DeepSeek所做的就是從OpenAI的模型中獲取知識。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見