-
日期: 2025-02-01 | 來源: 香港01 | 有1人參與評論 | 字體: 小 中 大
親中共媒體香港01報道:中國人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性價比高而廣受關注,成本多少成為外界焦點,半導體研究機構SemiAnalysis發表報告,估計DeepSeek公司歷年來的硬體投資支出為遠高於5億美元(約39億港元)。
DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的訓練成本為557.6萬美元(約4,349萬港元),低廉的成本引起關注。
文件注明成本僅包括V3的官方訓練(official training),不包括與架構、演算法或資料相關的先前研究和消融實驗(ablation experiments)的成本。
半導體研究與諮詢機構SemiAnalysis發表報告,估計DeepSeek公司的歷來硬體投資支出為遠高於5億美元(約39億港元),並指研發成本和整體成本也相當可觀,稱為模型訓練制作“合成資料”需要大量的計算力。
報告稱“為開發新的架構方法,在模型開發過程中,需要花費大量資金來測試新想法、新的架構理念和消融(ablations)。”
2023年時,外界估計OpenAI的GPT-4訓練成本達到6300萬美元(約4.9億港元)。
作為壹家中國AI初創公司,DeepSeek在海外遭到諸多質疑。(Reuters)- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接: