-
日期: 2025-02-25 | 來源: 學術頭條 | 有0人參與評論 | 專欄: 微軟 | 字體: 小 中 大
Satya Nadella:在規模上,沒有什麼是商品化的。關於雲計算的觀點,每個人都會說,“哦,雲計算是商品。”除非,當你做到規模化……這就是為什麼運營壹個超大規模公司需要特定的技術和經驗……你可以說,“哦,那有什麼難的?我可以把服務器堆疊起來。”
Dwarkesh Patel:沒錯。
Satya Nadella:事實上,在超大規模計算的早期,大多數人認為“有這麼多主機托管商,但那些不是什麼好生意。超大規模計算真的是生意嗎?它會有業務嗎?”結果證明,超大規模計算是壹個真實的生意,因為 Azure 擁有運行全球 60 多個地區所有計算的專門技術。這是很難復制的。
所以,我更想說的是,這是壹個贏家嗎?到底是不是贏家通吃?因為這壹點必須搞清楚。我喜歡參加 TAM(總可用市場)的類別,這樣就不會有贏家通吃的風險。最好的情況是,壹個大市場能容納幾個贏家,而你就是其中之壹。
這就是我所說的 hyperscale 層級。在模型層級,壹個模型最終需要在壹些 hyperscale 的計算平台上運行。所以,我覺得這種聯系將永遠存在。它不僅僅是模型;模型需要狀態,這意味著它需要存儲,還需要需要常規的計算資源來運行這些智能體和智能體環境。
因此,這就是為什麼我認為壹個人跑贏並建立壹個完整的模型的極限可能不會發生的原因。
Dwarkesh Patel:關於 hyperscaler 計算平台,順便說壹下,作為壹個 hyperscaler,你的優勢也很有趣,特別是在推理時擴展方面,如果這涉及到未來模型的訓練,你可以將數據中心和 GPU 的成本攤銷,不僅用於訓練,還可以再次用於推理。
我很好奇,你認為微軟和 Azure 是何種類型的 hyperscaler。是側重於預訓練的部分?還是提供 o3 類的推理?還是你們只是提供托管和部署市場上的任何單壹模型,對此保持中立?
Satya Nadella:這是個很好的問題。我們希望構建的計算平台在某種意義上是順應摩爾定律(Moore's Law)的。我認為,這就像我們過去做的所有事情壹樣:每年不斷刷新平台,按照這些設備的生命周期價值進行折舊,然後對機群進行非常好的布局,以便能高效地運行不同的任務。有時會有非常大的訓練任務,需要配置高度集中的峰值計算能力,並且這些任務也需要相互協同。這很好。我們應該有足夠的數據中心資源來滿足這些需求。
但歸根結底,這些都變得非常龐大,甚至在預訓練規模的情況下,如果需要持續進行,預訓練的規模有時也必須跨越數據中心的邊界。這壹切或多或少都存在。
那麼,很好,壹旦開始跨越預訓練的數據中心邊界,這和其他有什麼不同呢?我考慮的方式是,嘿,分布式計算將保持分布式,所以要構建你的平台,使其准備好應對大規模訓練任務,准備好進行測試時計算,甚至准備好——如果可能發生的強化學習最終實現了,你可以先建立壹個大模型,然後進行大量的強化學習。對我來說,這就像是更多的訓練計算,因為你想為不同的任務創造這些高度專業化、精煉的模型。
因此,你需要那樣的計算平台,然後是服務需求。歸根結底,光速就是光速,你不能在得克薩斯州建壹個數據中心,然後說,“我要從這裡為全世界提供服務。”
你必須在世界各地都有推理機群的基礎上為全世界提供服務。這就是我對我們構建真正超大規模平台的理解。
哦,順便說壹下,我希望我的存儲和計算也靠近這些所有的東西,因為不僅僅是 AI 加速器是無狀態的。我的訓練數據本身需要存儲,然後我想能夠多路復用多個訓練任務,我想能有內存,我希望能有這些環境,在這些環境中,智能體可以去執行程序。這就是我的想法。
全球經濟增長 10%
Dwarkesh Patel:你最近報告說,你們每年通過 AI 獲得的收入是 130 億美元。但如果你看看年增長率,按照這個趨勢,肆年後,你們的 AI 收入將是現在的 10 倍,達到 1300 億美元。如果這壹趨勢繼續下去,你預見到如何利用所有這些智能,如何實現這種工業規模的應用?
是通過 Office 嗎?是你們為其他公司提供部署平台嗎?要有 AGI,才能有 1300 億美元的收入?那會是什麼樣子?
Satya Nadella:這是個很好的問題,因為從某種程度上來說,如果我們真的會迎來這種爆炸性的、豐富的、可利用的智能商品,我們首先要觀察的就是國內生產總值(GDP)的增長。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見