-
日期: 2026-03-16 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小 中 大

Vera CPU采用LPDDR5X內存,帶寬高達1.2TB/s,是同類通用CPU的兩倍,功耗僅為壹半。結合NVLink-C2C技術,其與GPU間的互聯帶寬達1.8 TB/s,是傳統PCIe Gen 6的7倍。
單個 Vera CPU機架可集成256顆液冷方案Vera CPU,支持超過22500個並發線程獨立滿負荷運行,專為大規模“AI工廠”而生。
據介紹,目前已計劃部署Vera CPU的雲客戶包括:Meta、Oracle Cloud、CoreWeave 等;制造合作商涵蓋戴爾、HPE、聯想、超微電腦、華碩、富士康等。Redpanda 的測試顯示,Vera在處理實時數據流時的延遲降低了 5.5倍。相關產品預計將於2026年下半年上市。
03 Groq 3 LPX/LPU:填補GPU推理短板,超低延遲推理加速器
Groq 3 LPU芯片是英偉達專為極致低延遲推理設計的全新處理器。
在AI智能體時代,推理側需求正加速分化:大模型訓練依賴GPU的高吞吐算力,而面對需要極高交互性、超短響應時間的智能體任務,傳統GPU架構存在性能冗余。為此,英偉達正式引入LPU架構,專注於“極致低延遲的token生成”。
在硬件設計上,Groq 3 LPU芯片展現了與傳統GPU截然不同的技術路線。它摒棄了容量大但延遲相對較高的HBM顯存,單顆芯片集成了500MB的片上SRAM。雖然容量僅為Rubin GPU 的伍百分之壹,但其提供的帶寬高達150 TB/s,是HBM4(22 TB/s)的近7倍。
基於該芯片,英偉達推出了Groq 3 LPX平台(機架)。該平台采用液冷散熱,單個機架配備 256顆LPU處理器,累計提供128GB片上SRAM,總擴展帶寬達640TB/s。LPX平台作為Vera Rubin架構中的關鍵補齊,專注於承載大規模、高並發的低延遲推理工作負載。
當Groq 3 LPX平台與Vera Rubin NVL72結合使用時,這種混合架構實現了GPU強勁算力與 LPU極致帶寬的完美互補。在百萬token上下文場景下,其收益潛力可大幅提升。 該芯片及平台預計將於2026年下半年正式上市。
04 Vera Rubin Space Module:AI 算力飛向太空
英偉達這次還把AI算力直接送上了太空,發布了專門面向軌道數據中心(ODC)和太空操作的 Vera Rubin Space Module。
根據介紹,傳統衛星的工作模式是拍攝後將海量數據下載到地面處理,但這套流程正被“數據洪流”壓垮。因為壹顆地球觀測衛星每天可產生數TB數據,而星地通信帶寬有限、窗口期短,大量數據積壓等待傳輸。從拍攝到分析結果返回可能耗時數小時,錯過災害預警等場景的黃金窗口。
Vera Rubin Space Module 的核心思路是邊緣智能,讓衛星在軌完成目標檢測和變化分析,只下傳有價值的結果而非原始數據,從而大幅降低傳輸壓力。
英偉達表示,目前,像Axiom Space、Planet Labs這些太空賽道的頭牌公司,已開始用英偉達的加速平台來跑下壹代太空任務了。有了這種算力加持,無論是衛星自主運行還是地理空間智能分析,都將從“慢動作”變成實時響應。
黃仁勳表示:“相比H100 GPU,Rubin Space Module在太空推理算力上提升最高25倍,真正將數據中心級AI算力帶入太空”。
05 BlueField-4 STX:AI 原生存儲架構
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見