-
日期: 2024-09-13 | 來源: 新智元 | 有0人參與評論 | 字體: 小 中 大
o1的性能,隨著更多的強化學習(訓練時間計算)和更多的思考時間(測試時間計算)投入,性能不斷提高。
這壹方法,在Scaling時的限制,和LLM預訓練的限制,大不相同。
o1的性能隨著訓練階段和測試階段計算量的增加而平穩提升
金牌團隊壹覽
推理研究
在奠基貢獻者裡,離職創業的Ilya Sutskever赫然在列,但並沒有和Greg Brockman等人被列在執行管理(executive leadership)中,想必是他之前的研究工作為o1奠定了基礎。
Hongyu Ren
Hongyu Ren本科畢業於北大計算機科學專業,並在斯坦福獲得了博士學位,從去年7月起加入OpenAI,此前曾在谷歌、蘋果、英偉達、微軟等公司有過工作經歷。
Jason Wei
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見