-
日期: 2026-01-06 | 來源: 華爾街見聞 | 有0人參與評論 | 專欄: CES | 字體: 小 中 大
這是壹個我們非常自豪的領域,所有這些都是為了服務於你們構建AI代理(AI Agents)的能力。這真的是壹個開創性的發展領域。你知道,當ChatGPT剛出來的時候,人們說,天哪,它產生了非常有趣的結果,但幻覺非常嚴重。產生幻覺的原因當然是因為它可以記住過去的壹切,但它無法記住未來或當前的壹切。因此它需要扎根於研究。在回答問題之前,它必須進行基礎研究。推理的能力——我是否需要做研究?我是否需要使用工具?我如何將壹個問題分解成步驟?每壹個步驟都是AI模型知道如何做的事情。而在它們組合在壹起時,它能夠按順序執行從未做過、從未受過訓練去執行的事情。
這就是推理的美妙能力。我們可以遇到以前從未見過的情況,並將其分解為我們知道如何做的情境、知識或規則,因為我們在過去經歷過。因此,AI模型現在能夠進行推理的能力極其強大,代理的推理能力打開了通往所有這些不同應用的大門。我們不再需要在第壹天就訓練壹個AI模型知道所有事情,就像我們不需要在第壹天就知道所有事情壹樣,我們應該能夠在每種情況下推理如何解決那個問題。
大語言模型現在已經實現了這壹根本性的飛躍,使用強化學習和思維鏈(Chain of Thought)、搜索和規劃以及所有這些不同的技術和強化學習的能力,使得我們擁有這種基本能力成為可能,而且現在也完全開源了。
但真正棒的是另壹個突破。我第壹次看到它是在Aravind的Perplexity上。那家搜索公司,AI搜索公司,真正創新、真正的公司。我第壹次意識到他們同時使用多個模型時,我覺得這完全是天才之舉。當然,我們也會那樣做。
當然,AI也會在推理鏈的任何部分調用世界上所有偉大的AI來解決它想要解決的問題。這就是為什麼AI實際上是多模態的(Multi-modal),意味著它們理解語音、圖像、文本、視頻、3D圖形和蛋白質。那是多模態。它也是多模型(Multi-model)的,意味著它們應該能夠使用任何最適合任務的模型。根據定義,它是多雲的,因為這些AI模型位於所有這些不同的地方。它也是混合雲,因為如果你是壹家企業公司或你建造了壹個機器人或任何設備,有時它在邊緣,有時是無線電蜂窩塔,有時是在企業內部,或者可能是在醫院這樣你需要數據實時就在你身邊的地方。
無論那些應用是什麼,我們現在知道這就是未來AI應用的樣子。或者換個方式思考,因為未來的應用是建立在AI之上的。這是未來應用的基本框架。這個基本框架,這種能夠做我所說的事情的代理AI的基本結構,它是多模型的,現在已經為各種AI初創公司增壓。現在你也因為我們提供的所有開放模型和所有工具,你可以定制你的AI,教你的AI其他人沒有教的技能。沒有其他人讓他們的AI變得如此智能,如此聰明。你可以為自己做這件事。這就是我們在NeMo Tron、NeMo以及我們在開放模型方面所做的壹切工作的意圖。你在它前面放壹個智能路由器,那個路由器本質上是壹個管理者,它根據你給它的提示意圖,決定哪個模型最適合該應用,最適合解決那個問題。
好的,當你思考這個架構時,你得到了什麼?當你思考這個架構時,突然之間你擁有了壹個壹方面完全由你定制的 AI。你可以教它為你公司做特定的技能,那些領域機密的東西,那些你擁有深厚領域專業知識的東西,也許你擁有訓練該 AI 模型所需的所有數據。另壹方面,你的 AI 永遠處於前沿。根據定義,你壹方面永遠在前沿,另壹方面永遠是定制的,而且它應該就能運行。
所以我們認為我們會制作最簡單的示例,向你們提供這個完整的框架。我們稱之為藍圖(Blueprint)。我們有集成到全球企業 SaaS 平台中的藍圖,我們對進展感到非常高興。但我們要向你們展示壹個任何人都可以做的簡短示例。
演示視頻:
讓我們構建壹個個人助理。我希望它能幫我處理日歷、電子郵件、待辦事項列表,甚至幫我照看家裡。我使用 Brev 將我的 DGX Spark 變成個人雲。所以我可以使用相同的界面,無論我使用的是雲 GPU 還是 DGX Spark。我使用前沿模型 API 輕松上手。我希望它幫我處理電子郵件,所以我為我的智能體創建了壹個電子郵件工具。我希望我的電子郵件保持私密,所以我添加了壹個在 Spark 上本地運行的開放模型。
現在,對於任何工作,我都希望智能體使用正確的模型來完成任務,所以我將使用壹個基於意圖的模型路由器。這樣,需要電子郵件的提示將留在我的 Spark 上,其他所有內容都可以調用前沿模型。我希望我的助手與我的世界互動,所以我將它連接到 Hugging Face 的 Richie 迷你機器人。我的智能體通過工具調用控制 Richie 的頭、耳朵和攝像頭。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見