-
日期: 2026-06-01 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小 中 大
2026年6月1日,在COMPUTEX 2026期間舉辦的NVIDIA GTC Taipei大會上,英偉達創始人兼CEO黃仁勳發表主題演講。
距離上壹場GTC,不過叁個月。
當時,英偉達發布了Vera Rubin的“芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交換機,六顆芯片構成壹台機架級AI超算,並宣告訓練大型MoE模型所需GPU數量降至肆分之壹,推理吞吐量每瓦提升10倍,單token成本降至拾分之壹。
和之前強調“芯片全家桶”、“算力全家桶”這種系統級解決方案不同,叁個月後COMPUTEX,黃仁勳把目光投向這些基礎設施將服務目標——Agent。
黃仁勳在演講中透露:Vera Rubin正式進入量產,Vera CPU開始向全球交付,DGX Station第壹次以Windows形態走進企業桌面,Cosmos 3重構物理AI的感知框架,DSX成為AI工廠的運營操作系統。英偉達還聯合宇樹發布了H2 Plus——首款基於Isaac GR00T的人形機器人參考設計,把Agent的邊界從數字世界延伸到物理形態。
英偉達正在圍繞Agent生態,重新組織從芯片、數據中心、模型、軟件到機器人平台的完整技術體系。
黃仁勳說:“Agent AI和實用型人工智能時代已經到來。現在token(也稱‘詞元’)是利潤單位,AI是GDP‘生成器’,軟件工程師的數量正在增加。人們談論AI減少了工作崗位,這完全是胡說八道,實際上有更多的軟件工程師正在被雇用”。
01 同樣的AI工廠,跑出10倍Agent任務
Vera Rubin平台已全面投產。
與過去主要面向大模型訓練和推理不同,Vera Rubin從設計之初就把Agent作為重點工作負載。
黃仁勳在演講中表示,壹個Agent任務往往不只是壹次模型推理,而是包含推理、搜索、工具調用、代碼執行和結果驗證等多個環節,背後可能涉及數千個步驟。未來數據中心需要處理的,也不再只是單個模型請求,更多的是大量持續運行、相互協作的Agent任務。
該平台被定義為壹個巨大的、統壹的計算單元級AI超級計算機,專為處理從推理、檢索到工具使用的智能體工作負載而構建。在同樣規模的超大型數據中心裡,用全新的 Vera Rubin 平台來運行自主 AI 智能體的任務,其處理效率是上壹代 Grace Blackwell平台的 10 倍。
除了計算平台本身,網絡也成為Vera Rubin升級的重點之壹。
過去數據中心裡,GPU之間的數據傳輸主要依賴傳統光模塊和交換機架構,但當集群規模持續擴大後,功耗、散熱和部署復雜度都會快速上升。為此,英偉達在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics網絡系統。
這是英偉達首次將共封裝光學(CPO)技術大規模引入AI數據中心網絡。
簡單來說,傳統方案需要把光模塊插在交換機外部,而CPO則直接把光學器件集成到交換機內部,從而減少能耗和信號損失。
此外,安全也是此次Vera Rubin平台重點強調的核心能力。
為此,英偉達將機密計算(Confidential Computing)能力擴展到整個Vera Rubin平台。通過可信執行環境、硬件級驗證以及端到端加密機制,企業能夠在處理私有數據、行業敏感信息和關鍵模型時獲得更高等級的安全保障。
黃仁勳透露,Vera Rubin已經進入量產階段。作為第叁代MGX機架級系統,其背後涉及超過150家合作伙伴、350多座工廠以及覆蓋30多個國家和地區的供應鏈體系。按照英偉達公布的計劃,Vera Rubin將於今年秋季開始正式出貨。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見