-
日期: 2025-03-15 | 来源: 观察者 | 有0人参与评论 | 字体: 小 中 大
据报道,清华大学MADSys实验室已在软件源代码托管服务平台GitHub上启动了Mooncake项目,旨在加速该技术的采用和传播。与此同时,该项目已被包括阿里巴巴和蚂蚁集团在内的多家公司内部采用,并已融入开源社区。
今年1月,中国AI初创公司深度求索(DeepSeek)发布的开源大模型DeepSeek-R1,使用由英伟达H800 GPU驱动的数据中心进行训练,仅用两个月就完成了训练,成本为550万美元,仅为OpenAI等美国公司所花费金额的一小部分,却实现了足以匹敌美国顶尖AI模型的效果,“低成本且高效能”的特点不仅震撼业界,同时也引发多国关注,尤其是美国。
彭博社此前介绍称,在DeepSeek火爆出圈以及中国AI行业蓬勃发展之际,一些互联网公司多年来也一直在深耕AI领域,而此次与清华大学团队合作的月之暗面也是其中之一。
月之暗面公司由清华大学助理教授杨植麟创立,他此前曾在脸书母公司Meta和谷歌从事AI项目工作。月之暗面最新发布的产品利用强化学习来加速和扩展训练过程,该产品与DeepSeek的R1推理模型在同一天宣布,工作原理相似。推理模型采用思维链的方法来寻找和完善对查询的回答。Kimi k1.5旨在提供更简洁的回答,并支持最多200万字符的中文语境,这些语境可以包含从过往对话到用户意图和情境的所有内容。
FAST是计算机存储领域的顶级学术会议,已创立20余年,在存储领域具有重要影响力,被中国计算机学会(CCF)认定为存储系统领域的A类国际学术会议。
值得注意的是,除了此次在FAST上获奖之外,中方团队近期也在其他顶级学术界会议上频频获奖。
3月3日,在刚刚落幕的国际可重构计算领域顶级会议“FPGA 2025”上,会议的最佳论文奖颁发给了无问芯穹和上海交通大学、清华大学共同提出的视频生成大模型推理IP工作——FlightVGM。据了解,这是FPGA会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚洲国家团队首次获此殊荣。
据介绍,这项工作首次在可重构逻辑集成电路上实现了视频生成模型的高效推理,也是该团队继去年在FPGA上加速大语言模型FlightLLM(FPGA’24)后的最新系列工作。与英伟达3090 GPU相比,FlightVGM在AMD V80 FPGA上实现了1.30倍的性能提升与4.49倍的能效提升(峰值算力差距超过21倍)。
对此,《南华早报》在3月12日的报道中认为,在向美国科技巨头英伟达的AI硬件领域主导地位发起勇敢挑战中,中国研究人员在一款现成的工业芯片上训练出一个尖端视频生成模型,其在速度和效率上都超越了高端GPU。而这也预示着,全球优化AI硬件的竞赛出现了重大转变。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见