-
日期: 2026-01-06 | 來源: 華爾街見聞 | 有0人參與評論 | 專欄: CES | 字體: 小 中 大
接下來是物理AI(Physical AI)。這是壹個你們看我談論了幾年的領域。事實上,我們已經為此努力了八年。問題是,你如何將計算機內部的智能,那些通過屏幕和揚聲器與你互動的智能,轉變為可以與世界互動的智能,意味著它可以理解世界運作的常識。
物體恒存性。如果我看向別處再看回來,那個物體還在那裡。因果關系。如果我推它,它會倒下。它理解摩擦力和重力。它理解慣性。壹輛重型卡車沿路滾下需要更多時間停下來,而壹個球會繼續滾動。
這些概念對壹個小孩子來說都是常識,但對AI來說完全未知。所以我們必須創建壹個系統,允許AI學習物理世界的常識,學習其定律,當然也要能夠從數據中學習。數據非常稀缺,並且要能夠評估那個AI是否在工作,意味著它必須在環境中進行模擬。如果AI沒有能力模擬物理世界對其行動的反應,它怎麼知道它正在執行的行動是否符合它應該做的?對其行動反應的模擬對於評估非常重要。否則,就沒有辦法評估它。每次都不壹樣。所以這個基本系統需要叁台計算機。壹台計算機,當然是我們知道英偉達制造的用於訓練AI模型的。另壹台計算機是用於推理模型的,推理計算機本質上是壹台機器人計算機,運行在汽車裡或機器人裡或工廠裡,運行在邊緣的任何地方。
但必須有另壹台設計用於模擬的計算機。模擬幾乎是英偉達所做壹切的核心。這是我們最舒適的地方,模擬真的是我們用物理AI所做幾乎壹切的基礎。所以我們有叁台計算機和運行在這些計算機上的多個堆棧,這些庫使它們變得有用。Omniverse是我們的數字孿生、基於物理的模擬世界。Cosmos,如我之前提到的,是我們的基礎模型,不是語言的基礎模型,而是世界的基礎模型,並且也與語言對齊。你可以說像“球發生了什麼?”它會告訴你球正滾下街道。所以是壹個世界基礎模型。然後當然是機器人模型。我們有兩個。壹個叫GR00T,另壹個叫Alpamayo,我現在要告訴你們。
我們對物理 AI 必須做的最重要的事情之壹是創建數據來首先訓練 AI。數據從哪裡來?與其像語言那樣因為我們創建了大量文本作為 AI 學習的“基准真理(Ground Truth)”,我們如何教 AI 物理的基准真理?有很多很多視頻,但很難捕捉到我們需要的多樣性和交互類型。所以這就是偉大的頭腦聚集在壹起,將曾經的計算轉化為數據的地方。
現在使用以物理定律為基礎和條件、以基准真理為基礎和條件的合成數據生成(Synthetic Data Generation),我們可以選擇性地、巧妙地生成我們可以用來訓練 AI 的數據。例如,進入左邊這個 Cosmos AI 世界模型的是交通模擬器的輸出。現在這個交通模擬器對於 AI 學習來說遠遠不夠。我們可以把它放入 Cosmos 基礎模型中,生成基於物理且在物理上合理的環繞視頻,AI 現在可以從中學習。這方面有很多例子。讓我向你們展示 Cosmos 能做什麼。
“物理AI的ChatGPT時刻即將到來。”
Cosmos是世界領先的基礎模型,世界基礎模型。它已被下載數百萬次,在世界各地使用,讓世界為這個物理AI的新時代做好准備。我們也自己使用它。我們自己使用它來創建我們的自動駕駛汽車,用於場景生成和評估。我們可以擁有讓我們有效行駛數拾億、數萬億英裡,但在計算機內部完成的東西。我們取得了巨大的進步。今天,我們宣布Alpamayo,世界上第壹款會思考、推理的自動駕駛汽車AI。
Alpamayo是端到端訓練的,字面意思是從攝像頭輸入到執行輸出。攝像頭輸入大量由它自己駕駛的裡程,或是我們人類駕駛的,使用人類演示。我們還有大量由Cosmos生成的裡程。除此之外,成千上萬的例子被非常仔細地標記,以便我們可以教汽車如何駕駛。
Alpamayo做了壹些非常特別的事情。它不僅接收傳感器輸入並激活方向盤、刹車和加速,它還推理它將要采取的行動。它告訴你它將要采取什麼行動,它得出那個行動的理由,當然還有軌跡。所有這些都直接耦合,並由大量人類訓練以及Cosmos生成的數據非常具體地訓練。結果真的令人難以置信。你的車不僅像你期望的那樣駕駛,而且它駕駛得如此自然,因為它直接從人類演示者那裡學習。但在每壹個場景中,當它遇到場景時,它會推理,它告訴你它要做什麼,並推理它將要做什麼。
為什麼這如此重要?因為駕駛的長尾效應。我們不可能簡單地為每個國家、每種情況、所有人口可能發生的每壹件可能的事情收集每壹個可能的場景。然而,每種場景很有可能分解成壹大堆其他較小的場景,這對你來說理解起來很正常。因此,這些長尾將被分解成汽車知道如何處理的相當正常的情況,它只需要對其進行推理。
讓我們來看壹下。你們即將看到的壹切都是壹次通過,不需動手。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見