-
日期: 2025-02-06 | 来源: 新智元 | 有0人参与评论 | 专栏: 哈佛 | 字体: 小 中 大
潘梓正2024年全职加入DeepSeek,担任研究员。他曾在英伟达AI算法组担任研究实习生。
2021年,潘梓正加入蒙纳士大学(Monash University)ZIP Lab攻读计算机科学博士,导师是Bohan Zhuang教授和Jianfei Cai教授。在此之前,他分别获得阿德莱德大学(University of Adelaide)计算机科学硕士和哈尔滨工业大学(威海)软件工程学士学位。
在博士期间,潘梓正的研究兴趣主要集中在深度神经网络的效率方面,包括模型部署、Transformer架构优化、注意力机制、 推理加速和内存高效的训练。

Lex Fridman硬核播客,揭秘中国AI新星如何撼动全球格局
就在最近,Lex Fridman放出了一期长达5小时的播客,邀请了AI2的模型训练专家Nathan Lambert和Semianalysis硬件专家Dylan Patel。
在这期信息量爆棚的谈话中,他们全程聚焦DeepSeek,讨论了这颗中国AI新星如何撼动全球格局、MoE架构+MLA的技术双刃、DeepSeek开源倒逼行业开放进程、中国式极限优化之道的硬件魔术等。
DeepSeek到底用没用OpenAI数据
这次,几位大佬的谈话内容可谓相当犀利,直指问题核心。
比如这个关键问题:DeepSeek究竟用没用OpenAI的数据?
此前,OpenAI公开表示,DeepSeek使用了自家的模型蒸馏。
- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见