-
日期: 2025-11-27 | 來源: 騰訊科技 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
“我們距離頂尖水平還差得很遠。”兩年半前,當谷歌DeepMind啟動Gemini項目時,首席技術官兼首席AI架構師科雷·卡武克喬格魯在內部會議上直言不諱。
那時的谷歌,在大模型賽道上明顯落後,AI Studio僅有3萬用戶且零收入,團隊在激烈的競爭中承受著巨大壓力。
從坦誠落後到Gemini 3引爆市場,谷歌完成了壹場令人矚目的逆襲。這場翻身仗的背後,是叁個關鍵轉變:
第壹, 從實驗室思維轉向戰場思維,建立“每六個月重大迭代”的更新節奏;
第贰, 放棄大而全,聚焦叁大殺手鑭,讓模型真正理解人類意圖、服務全球用戶、具備使用和創造工具的能力;
第叁, 激活谷歌的終極武器,調動六大洲2500名專家,實現從芯片層到搜索、Android等億級產品的端到端協同。
在這場關乎未來的AI軍備競賽中,壹家巨頭如何放下身段承認落後,又如何在短短兩年半內後來居上?在與GoogleDeepMind高級產品經理洛根·基爾帕特裡克的對話中,卡武克喬格魯首次揭示了逆襲背後的真實故事。
以下為卡武克喬格魯專訪精華內容:
問:Gemini 3發布後市場反饋積極,你如何評價這壹代模型的突破?
卡武克喬格魯:在完成基准測試和預發布驗證後,Gemini 3的實際表現確實達到了我們的預期。這個模型不僅具備強大的技術能力,更重要的是在真實應用場景中獲得了用戶的認可。雖然仍有完善空間,但目前的反饋令人鼓舞,用戶關注的創新點與我們設定的技術方向高度壹致。
問:從Gemini 2.5到Gemini 3.0,技術進步的速度似乎仍在加速。你如何看待這種發展態勢?
卡武克喬格魯:當前AI領域確實保持著驚人的創新節奏。無論是在基礎研究還是工程實踐層面,我們都看到了持續突破。這種進步源於壹個良性循環:當技術在實際場景中產生價值時,我們會獲得更多反饋,進而催生新的創新思路。隨著待解決問題的復雜度和多樣性不斷提升,這種挑戰反而推動著我們向前發展。
問:基准測試在技術發展中扮演著怎樣的角色?
卡武克喬格魯:基准測試與模型開發是相輔相成的關系。比如,以號稱“人類最後考試”的HLE(衡量AI解決人類級復雜難題能力)基准測試中,早期模型只能達到1%或2%的水平,如今DeepThink之類的先進模型已能突破40%的水平。而像GPQA Diamond這樣的挑戰性基准,雖然我們仍在逐步提升其中1%的性能,但它們確實指向了尚未完全解決的核心難題。
問:在GPQA等基准測試上的進展,是否意味著我們需要重新定義技術前沿?
卡武克喬格魯:基准測試確實重要,但它與真實進步之間並非完全劃等號。在我看來,衡量技術進步的根本標准在於實際應用。當科學家借助模型推進研究、學生通過它完成學業、工程師利用它解決實際問題時,當這些工具真正融入人類知識工作的各個環節,我們才能說實現了真正的進步。基准測試的作用,在於為這種進步提供可量化的參照維度。
叁大技術支柱與產品飛輪:Gemini 3的破局之道
問:在模型迭代過程中,團隊如何確定技術突破的重點方向?對於Gemini,特別是Pro模型,你們試圖在哪些方面進行重點提升?
卡武克喬格魯:我們主要聚焦叁個核心維度:
首先是精准的意圖理解。模型必須准確捕捉用戶指令的深層意圖,而非簡單地進行模式匹配。這需要突破傳統應答邏輯,建立真正的任務理解與執行能力。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見