解碼DeepSeek模式:幻方量化拾年孵化出OpenAI殺手

日期: 2025-01-27 | 來源: 未盡研究 | 有0人參與評論 | 字體: 小中大
去年底，我們寫了壹篇筆記，《2024年，DeepSeek帶給硅谷“苦澀的教訓”》，提出了壹個觀點，相比聖誕前OpenAI的連續12天線上發布會，DeepSeek-V3的發布，才是當年真正的壓軸戲。

沒想到這篇文章引發了壹陣狂炒。DeepSeek-R1推理模型就在特朗普(专题)就職日那天發布，性能基本超過了GPT-4o，媲美OpenAI-o1，成本僅為其拾分之壹到贰拾分之壹。這次不僅讓硅谷懵逼，而且讓華爾街也不安起來。

尤其是特朗普宣布了任期內投資5000億美元AI基礎設施的星際之門計劃，由軟銀、OpenAI和甲骨文操盤，微軟、英偉達、ARM等為技術伙伴，更是把美國的AI發展的資本+算力模式推到了壹個新的高度，還不用說其他科技巨頭每年高達數千億的資本支出主要投向AI。但DeepSeek以高效的訓練和推理，讓砸錢搞GPU軍備競賽的AI發展模式開始遭到壹些質疑，建立在這壹基礎之上的AI概念公司，無論在壹級市場，還是在贰級市場，都面臨著壹次估值的拷問。

相比之下，DeepSeek正在探索壹條中國式的AI發展之路，我們在對2025年AI的拾個展望中，第壹條就提出來，中國將參與基礎模型的創新，而不僅僅是跟隨。辭舊迎新之際，我們再度對DeepSeek進行壹次”模式“級別的梳理，分下面肆個部分：

1，深度求索有深度

2，螢火和R1論文

3，DeepSeek沖擊

4，改寫AI游戲規則

深度求索有深度

DeepSeek遠遠不像是許多介紹的、尤其是海外報道和傳說中的那樣，是壹家僅成立壹年多的AI公司。實際上它脫胎於幻方量化基金，這是壹家已經創辦了17年的、有數學、計算、研究和AI基因的對沖基金。

2008年，浙江大學學習信息與通信工程的梁文鋒創立了幻方量化，直到2014年，在幻方量化的初創階段，團隊從零開始探索全自動化交易。

2015年才是幻方自認為的創始元年，真正依靠數學與人工智能進行量化投資。“創始團隊意氣風發、勇於創新、勤勉奮進，立志成為世界頂級的量化對沖基金。”2016年，幻方第壹個AI模型建立的股票倉位上線實盤交易，算力開始從CPU轉向GPU。至 2017 年底，幾乎所有的量化策略都已經采用 AI 模型計算。

作為壹家對沖基金，幻方開始確立以 AI 為公司的主要發展方向。但是，復雜的模型計算需求使得單機訓練遭遇算力瓶頸，同時日益增加的訓練需求和有限的計算資源產生了矛盾，2018年，幻方的AI團隊開始尋求大規模算力解決方案。

其實2019年可能是幻方大模型之路的起點，這壹年，幻方AI（幻方人工智能基礎研究有限公司）注冊成立，致力於 AI 的算法與基礎應用研究。AI 軟硬件研發團隊自研幻方“螢火壹號”AI集群，搭載了500塊顯卡，使用 200Gbps 高速網絡互聯。壹年之間，“螢火壹號”總投資近2億元，於2020年正式投用，滿血搭載1100塊加速卡，為幻方的AI研究提供算力支持。

幻方AI很快又投入10億元建設螢火贰號。2021年，螢火贰號壹期確立以任務級分時調度共享AI算力的技術方案，從軟硬件兩方面共同發力：高性能加速卡、節點間 200Gbps 高速網絡互聯、自研分布式並行文件系統（3FS）、網絡拓撲通訊方案（hfreduce）、算子庫（hfai.nn），高易用性應用層等，將螢火贰號的性能發揮至極限。

到了2022年，ChatGPT時刻前夕，幻方已經成為國內壹家領先的AI公司，而且手中握有上萬塊英偉達A100卡和壹定數量的AMD卡。螢火贰號取得了多800口交換機互聯加核心擴展子樹的軟硬件架構革新，突破了壹期的物理限制，算力擴容翻倍。新的hfai框架讓模型加速50-100%。集群連續滿載運行，平均占用率達到96%以上。全年運行任務135萬個，共計5674萬 GPU 時。用於科研支持的閒時算力高達1533 萬GPU 時，占比27%。

從中可以推算出，在2022年，幻方已經平均每天用4.2萬GPU時，相當於每天有近2000張GPU卡在幾乎滿負荷跑科研而不是交易。如果按照當時A100每小時雲服務的市場價，相當於每年在科研方面投入2億元人民幣(专题)。這樣規模的AI研究，在當時的國內處於領先狀態，在當時的國際上巨頭之外的AI初創公司中，也算得上是領先的。

2023年4月11日，開源模型Llama1和GPT-4和相繼發布之後，幻方宣布做大模型，2023年5月把技術部門做大模型的團隊獨立出來，成立深度求索公司，進軍通用人工智能AGI。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 5 6 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞