-
日期: 2024-09-13 | 來源: 新智元 | 有0人參與評論 | 字體: 小 中 大
OpenAI研究員Jason Wei表示,o1-mini是自己過去壹年看到的最令人驚訝的研究成果。壹個小模型,居然在AIME數學競賽中獲得了高於60%的成績。
不過,從OpenAI文章中的附錄來看,這次放出的preview和mini似乎都只是o1的「閹割版」。
推理Scaling新范式開啟
英偉達高級科學家Jim Fan對o1模型背後原理做了進壹步解析。
他表示,推理時間Scaling新范式正在大范圍普及和部署。正如Sutton在「苦澀的教訓」中所言,只有兩種技術可以無限scaling計算能力:學習和搜索。
現在,是時候將重點轉向後者了。
1. 進行推理不需要巨大的模型。
2. 大量計算從預訓練/後訓練,轉移到推理服務
3. OpenAI壹定很早就發現了推理scaling法則,而學術界最近才開始發現
5. Strawberry很容易成為壹個數據飛輪
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見