壹文讀懂英偉達GTC 2026:給"龍蝦"裝安全圍欄

日期: 2026-03-16 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小中大
Vera CPU采用LPDDR5X內存，帶寬高達1.2TB/s，是同類通用CPU的兩倍，功耗僅為壹半。結合NVLink-C2C技術，其與GPU間的互聯帶寬達1.8 TB/s，是傳統PCIe Gen 6的7倍。

單個 Vera CPU機架可集成256顆液冷方案Vera CPU，支持超過22500個並發線程獨立滿負荷運行，專為大規模“AI工廠”而生。

據介紹，目前已計劃部署Vera CPU的雲客戶包括：Meta、Oracle Cloud、CoreWeave 等；制造合作商涵蓋戴爾、HPE、聯想、超微電腦、華碩、富士康等。Redpanda 的測試顯示，Vera在處理實時數據流時的延遲降低了 5.5倍。相關產品預計將於2026年下半年上市。

03 Groq 3 LPX/LPU：填補GPU推理短板，超低延遲推理加速器

Groq 3 LPU芯片是英偉達專為極致低延遲推理設計的全新處理器。

在AI智能體時代，推理側需求正加速分化：大模型訓練依賴GPU的高吞吐算力，而面對需要極高交互性、超短響應時間的智能體任務，傳統GPU架構存在性能冗余。為此，英偉達正式引入LPU架構，專注於“極致低延遲的token生成”。

在硬件設計上，Groq 3 LPU芯片展現了與傳統GPU截然不同的技術路線。它摒棄了容量大但延遲相對較高的HBM顯存，單顆芯片集成了500MB的片上SRAM。雖然容量僅為Rubin GPU 的伍百分之壹，但其提供的帶寬高達150 TB/s，是HBM4（22 TB/s)的近7倍。

基於該芯片，英偉達推出了Groq 3 LPX平台（機架）。該平台采用液冷散熱，單個機架配備 256顆LPU處理器，累計提供128GB片上SRAM，總擴展帶寬達640TB/s。LPX平台作為Vera Rubin架構中的關鍵補齊，專注於承載大規模、高並發的低延遲推理工作負載。

當Groq 3 LPX平台與Vera Rubin NVL72結合使用時，這種混合架構實現了GPU強勁算力與 LPU極致帶寬的完美互補。在百萬token上下文場景下，其收益潛力可大幅提升。該芯片及平台預計將於2026年下半年正式上市。

04 Vera Rubin Space Module：AI 算力飛向太空

英偉達這次還把AI算力直接送上了太空，發布了專門面向軌道數據中心（ODC）和太空操作的 Vera Rubin Space Module。

根據介紹，傳統衛星的工作模式是拍攝後將海量數據下載到地面處理，但這套流程正被“數據洪流”壓垮。因為壹顆地球觀測衛星每天可產生數TB數據，而星地通信帶寬有限、窗口期短，大量數據積壓等待傳輸。從拍攝到分析結果返回可能耗時數小時，錯過災害預警等場景的黃金窗口。

Vera Rubin Space Module 的核心思路是邊緣智能，讓衛星在軌完成目標檢測和變化分析，只下傳有價值的結果而非原始數據，從而大幅降低傳輸壓力。

英偉達表示，目前，像Axiom Space、Planet Labs這些太空賽道的頭牌公司，已開始用英偉達的加速平台來跑下壹代太空任務了。有了這種算力加持，無論是衛星自主運行還是地理空間智能分析，都將從“慢動作”變成實時響應。

黃仁勳表示：“相比H100 GPU，Rubin Space Module在太空推理算力上提升最高25倍，真正將數據中心級AI算力帶入太空”。

05 BlueField-4 STX：AI 原生存儲架構
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁 1 234 5 6 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞