黃仁勳的新故事:"Agent工廠"裡,裝的是什麼?

日期: 2026-06-01 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小中大
2026年6月1日，在COMPUTEX 2026期間舉辦的NVIDIA GTC Taipei大會上，英偉達創始人兼CEO黃仁勳發表主題演講。

距離上壹場GTC，不過叁個月。

當時，英偉達發布了Vera Rubin的“芯片全家桶”，包括：Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交換機，六顆芯片構成壹台機架級AI超算，並宣告訓練大型MoE模型所需GPU數量降至肆分之壹，推理吞吐量每瓦提升10倍，單token成本降至拾分之壹。

和之前強調“芯片全家桶”、“算力全家桶”這種系統級解決方案不同，叁個月後COMPUTEX，黃仁勳把目光投向這些基礎設施將服務目標——Agent。

黃仁勳在演講中透露：Vera Rubin正式進入量產，Vera CPU開始向全球交付，DGX Station第壹次以Windows形態走進企業桌面，Cosmos 3重構物理AI的感知框架，DSX成為AI工廠的運營操作系統。英偉達還聯合宇樹發布了H2 Plus——首款基於Isaac GR00T的人形機器人參考設計，把Agent的邊界從數字世界延伸到物理形態。

英偉達正在圍繞Agent生態，重新組織從芯片、數據中心、模型、軟件到機器人平台的完整技術體系。

黃仁勳說：“Agent AI和實用型人工智能時代已經到來。現在token（也稱‘詞元’）是利潤單位，AI是GDP‘生成器’，軟件工程師的數量正在增加。人們談論AI減少了工作崗位，這完全是胡說八道，實際上有更多的軟件工程師正在被雇用”。

01 同樣的AI工廠，跑出10倍Agent任務

Vera Rubin平台已全面投產。

與過去主要面向大模型訓練和推理不同，Vera Rubin從設計之初就把Agent作為重點工作負載。

黃仁勳在演講中表示，壹個Agent任務往往不只是壹次模型推理，而是包含推理、搜索、工具調用、代碼執行和結果驗證等多個環節，背後可能涉及數千個步驟。未來數據中心需要處理的，也不再只是單個模型請求，更多的是大量持續運行、相互協作的Agent任務。

該平台被定義為壹個巨大的、統壹的計算單元級AI超級計算機，專為處理從推理、檢索到工具使用的智能體工作負載而構建。在同樣規模的超大型數據中心裡，用全新的 Vera Rubin 平台來運行自主 AI 智能體的任務，其處理效率是上壹代 Grace Blackwell平台的 10 倍。

除了計算平台本身，網絡也成為Vera Rubin升級的重點之壹。

過去數據中心裡，GPU之間的數據傳輸主要依賴傳統光模塊和交換機架構，但當集群規模持續擴大後，功耗、散熱和部署復雜度都會快速上升。為此，英偉達在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics網絡系統。

這是英偉達首次將共封裝光學（CPO）技術大規模引入AI數據中心網絡。

簡單來說，傳統方案需要把光模塊插在交換機外部，而CPO則直接把光學器件集成到交換機內部，從而減少能耗和信號損失。

此外，安全也是此次Vera Rubin平台重點強調的核心能力。

為此，英偉達將機密計算（Confidential Computing）能力擴展到整個Vera Rubin平台。通過可信執行環境、硬件級驗證以及端到端加密機制，企業能夠在處理私有數據、行業敏感信息和關鍵模型時獲得更高等級的安全保障。

黃仁勳透露，Vera Rubin已經進入量產階段。作為第叁代MGX機架級系統，其背後涉及超過150家合作伙伴、350多座工廠以及覆蓋30多個國家和地區的供應鏈體系。按照英偉達公布的計劃，Vera Rubin將於今年秋季開始正式出貨。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 5 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞