不是什麼都叫"世界模型",李飛飛給出新定義

日期: 2026-06-05 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小中大
斯坦福大學AI科學家、World Labs創始人李飛飛。圖片經由AI處理

文丨謝瑞瑞

編輯丨徐青陽

“世界模型”是過去兩年AI領域最常被提及的概念之壹，但它的含義正在變得越來越模糊。

視頻生成模型、語言模型，甚至連物理引擎都能自稱是世界模型。

斯坦福大學AI科學家、World Labs創始人李飛飛於6月4日撰文，專門回應這種混亂。她開篇便給出判斷：世界模型是當今AI領域最重要、也最被濫用的術語之壹。

她在文中寫道，連古希臘人都沒給“世界”下過壹個統壹、公認的定義。“世界”從來不是壹個具體的事物，今天，AI也繼承了同樣的問題——世界模型的邊界在哪裡？

李飛飛的解決思路很明確：先分清世界模型的叁個核心功能——渲染、模擬、規劃。

01 理解世界模型的鑰匙，是壹張舊圖

在展開論述之前，李飛飛先回顧了壹張在強化學習領域使用了幾拾年的框架圖：部分可觀測馬爾可夫決策過程（Partially Observable Markov Decision Process，POMDP）。這個框架的名稱很復雜，但邏輯卻簡明。

李飛飛將目前的世界模型系統分為叁類，分別是渲染器、模擬器以及規劃器

它描述的是壹個循環：智能體采取行動，行動改變世界的狀態，智能體從環境中獲得觀測值，再依據觀測采取下壹步行動。循環持續進行。

文中的“狀態”，指的是物理學和機器人學中的概念：在某個時刻對世界狀況的完整描述，涵蓋每壹個物體、每壹個位置、每壹組速度和每壹項屬性，對身處其中的任何智能體而言，永遠無法被完全直接感知。我們能得到的，只是對現實的部分觀測。

李飛飛進壹步指出，這個由“智能體—行動—狀態—觀測—回到智能體”構成的閉環，賦予了現代世界模型真正的技術內核。

“世界模型”概念，最早可以追溯到1943年，由心理學家肯尼斯·克雷克（Kenneth Craik）在1943年提出，即大腦通過運行現實的“小規模模型”來進行推理。到了20世紀80年代末、90年代初，這個概念被引入神經網絡研究。而今天，所有被稱為世界模型的事物，本質上都是同壹個循環在不同方向上的投影，每壹類只輸出循環中的壹個片段。

02 叁類世界模型：渲染器、模擬器與規劃器

李飛飛認為，當前所有自稱世界模型的系統可分為叁類：渲染器、模擬器和規劃器。

第壹類世界模型是渲染器。它的輸出是供人眼觀看的像素，核心評估指標是視覺逼真度。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞