-
日期: 2025-10-18 | 来源: 钛媒体APP | 有0人参与评论 | 字体: 小 中 大
在李飞飞看来,空间智能与世界模型是解决 AI 技术难题的关键法宝。
相对于其他世界模型技术,李飞飞团队认为,在世界模型的性能不变下,需要减少单卡算力资源投入,用性价比更高的方式解决世界模型和空间智能的实时交互问题。
若直接套用现有视频架构,生成60帧的4K交互视频流每秒需产生超过10万个token(约等于《弗兰肯斯坦》或首部《哈利·波特》的篇幅),而要维持一小时以上的持续交互,需处理的上下文token更将突破1亿大关,但基于当前计算基础设施,这既不可行也不具备经济性。
因此,今年3月,李飞飞联合Ben Mildenhall、Justin Johnson、Christoph Lassner三位学者创立World Labs,并研发出RTFM——具备高效性、可扩展性、持久性三大核心优势。
其中,高效性体现在单块H100 GPU即可支撑交互式帧率推理;可扩展性方面,其通用端到端架构能随数据与算力增长不断优化;持久性则依靠“带位姿帧空间记忆”与“上下文调度”技术,实现世界场景“永不消逝”,用户长时间交互也能保持场景一致性。
融资方面,今年9月,World Labs宣布获得2.3亿美元(约合人民币16亿元)融资,由a16z、NEA恩颐投资和Radical Ventures领投,AMD、Adobe、Databricks的风投部门和Shinrai Investments LLC,更有黄仁勋执掌的英伟达创投部门参与投资。
公司团队约24人,其中包括李飞飞在内共4位联合创始人,而华人面孔约占据了三分之一。
公开报道显示,World Labs成立3个月估值便达到10亿美元(约合70亿元)。
对于World Labs未来规划,投资人曾透露,李飞飞团队第一阶段将构建一个对三维、物理以及空间和时间概念有深入理解的空间智能大模型LWM;接下来大模型将支持AR;再之后,大模型将作用于机器人技术,改进自动驾驶汽车、自动化工厂、人形机器人等领域。
李飞飞表示,团队最早将在2025年推出产品,并表示现在只是刚起步,在盈利模式等问题上有很多边界需要突破,相信团队能够解决。
除了World Labs,李飞飞还在打造Behavior视觉挑战比赛,希望能复制当年ImageNet的成功——ImageNet已成为深度学习革命的关键催化剂,并正式开启以深度学习为核心的AI热潮,因此李飞飞被视为“让AI真正看懂世界”的推动者之一。
李飞飞认为,创建Behavior的灵感来自我们在机器人学习中遇到的三个主要痛点:1、任务缺乏标准化,研究往往依赖随机设定,导致不同论文之间难以比较;2、缺乏统一的任务体系,很多研究任务非常短、非常局限;3、缺乏训练数据。
今年10月,李飞飞正式发布了Behavior 1K,也就是Behavior 1000挑战。
这是一个面向具身智能与机器人研究的综合仿真基准与训练环境。它包含了1000个任务,主要聚焦在日常家庭环境中的“长时序任务”(long-horizon tasks),也就是需要多个动作步骤才能完成的真实任务。Behavior为全球研究者提供了一个开放源码的训练与评测平台,让不同机构可以在相同标准下训练算法、进行比较和评估。
“更让我兴奋的是,我们正处在一个文明性的转折时刻:语言、空间、视觉、具身智能等多种AI技术正在融合,并开始真正改变人类社会。只要我们始终把‘以人为本’放在心中,这些技术就能成为造福人类的力量。”李飞飞近期表示。
李飞飞团队表示,未来World Labs将进一步增强模型动态场景模拟与用户交互功能,更大规模模型有望带来更优性能。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见