-
日期: 2025-02-06 | 來源: 新智元 | 有0人參與評論 | 專欄: 哈佛 | 字體: 小 中 大
潘梓正2024年全職加入DeepSeek,擔任研究員。他曾在英偉達AI算法組擔任研究實習生。
2021年,潘梓正加入蒙納士大學(Monash University)ZIP Lab攻讀計算機科學博士,導師是Bohan Zhuang教授和Jianfei Cai教授。在此之前,他分別獲得阿德萊德大學(University of Adelaide)計算機科學碩士和哈爾濱工業大學(威海)軟件工程學士學位。
在博士期間,潘梓正的研究興趣主要集中在深度神經網絡的效率方面,包括模型部署、Transformer架構優化、注意力機制、 推理加速和內存高效的訓練。

Lex Fridman硬核播客,揭秘中國AI新星如何撼動全球格局
就在最近,Lex Fridman放出了壹期長達5小時的播客,邀請了AI2的模型訓練專家Nathan Lambert和Semianalysis硬件專家Dylan Patel。
在這期信息量爆棚的談話中,他們全程聚焦DeepSeek,討論了這顆中國AI新星如何撼動全球格局、MoE架構+MLA的技術雙刃、DeepSeek開源倒逼行業開放進程、中國式極限優化之道的硬件魔術等。
DeepSeek到底用沒用OpenAI數據
這次,幾位大佬的談話內容可謂相當犀利,直指問題核心。
比如這個關鍵問題:DeepSeek究竟用沒用OpenAI的數據?
此前,OpenAI公開表示,DeepSeek使用了自家的模型蒸餾。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見