-
日期: 2025-11-27 | 來源: 騰訊科技 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
問:關於統壹模型架構的願景,目前面臨哪些核心技術挑戰?
卡武克喬格魯:我們正穩步推進統壹模型架構的探索,不同模態的模型確實呈現出架構收斂的趨勢。但這本質上是壹個遵循科學規律的探索過程,我們需要通過不斷提出假設和驗證來推進,成功與失敗都是技術發展的必經之路。
當前的核心挑戰在於模型輸出空間的本質差異。模型現有的強大能力主要源於代碼和文本提供的結構化學習信號,而圖像生成則要求模型同時達到兩個維度的標准:既要實現像素級的精確還原,又要確保視覺元素在整體概念上的高度連貫。這種雙重標准使得訓練壹個能均衡處理多模態任務的模型變得尤為復雜。
我相信這個技術目標終將實現,但關鍵在於我們需要找到那個能夠打破現狀的關鍵創新點,從而讓模型真正融會貫通不同模態的能力。
協作密碼:從AlphaFold到Gemini的組織進化
問:作為DeepMind的第壹位深度學習研究員,回顧這13年的旅程,你有何感想?
卡武克喬格魯:2012年我加入DeepMind時,專注於深度學習的初創公司還很少見。當時我和我的朋友Carl Greger都在NYU的Yann Lab,我們同時加入了DeepMind。這個地方真正專注於構建智能,而深度學習正是其核心,這讓我感到非常興奮。從深度學習開始,到強化學習、智能體系統,我們始終秉持著以學習為核心的第壹性原理。這段旅程確實令人振奮。
但我反思時也感到,我們很幸運能生活在這個時代。AI現在正在發生,不僅僅是因為機器學習和深度學習,還因為硬件演進達到了某種狀態,互聯網和數據也達到了某種狀態。很多因素匯聚在壹起,讓我們能夠見證這個時刻。我們做出了選擇投身AI領域,但同時也非常幸運能在這個時代處於這個位置。
問:從AlphaFold到Gemini,您認為DeepMind在組織層面形成了哪些獨特的能力?
卡武克喬格魯:我們通過壹系列重大項目積累了獨特的經驗。從早期的DQN、AlphaGo、AlphaZero到AlphaFold,每個項目都教會我們如何圍繞明確目標、使命組建團隊。在DeepMind創立初期,25人共同完成壹個研究項目並聯合發表論文的做法曾讓學界驚訝,但這正是我們刻意培養的協作模式。
近年來,我們進壹步將研究思維與工程思維深度融合。現在我們已經建立起模型主線的開發節奏,並學會在保持主線穩定的同時進行技術探索。DeepThink模型就是壹個典范,我們選擇國際數學奧林匹克競賽這類極具挑戰性的目標,但堅持基於通用模型架構進行優化,最終讓競賽級模型能夠惠及所有用戶。
問:從早期25人合作論文到如今Gemini 3可能涉及2500名貢獻者,這種規模變化意味著什麼?
卡武克喬格魯:這種規模躍遷確實令人驚歎,但恰恰體現了谷歌作為技術生態系統的獨特優勢。我們擁有從芯片設計、數據中心架構到算法研發的全棧專家,這種深度整合能力讓我們能夠實現真正的端到端優化。
當模型設計與硬件研發形成雙向反饋——我們基於硬件特性優化模型架構,同時根據模型需求定制下壹代芯片——技術演進就進入了良性循環。這種緊密協同需要數千名頂尖專家的精密配合,而谷歌正具備這樣的大規模協作能力。
在規模化與顛覆性創新之間:DeepMind的永恒平衡術
問:在當今時代,DeepMind如何平衡基礎科學研究與Gemini模型的規模化擴展?
卡武克喬格魯:保持這種平衡確實是我們面臨的核心挑戰。即便現在,當我思考Gemini發展的最大風險時,始終認為是創新源泉的枯竭。我從不相信我們已經找到了可以簡單復制的"成功配方",只需按圖索驥就能實現智能。
真正的突破永遠來自創新——無論是沿著現有技術路徑的深化探索,還是開辟全新的研究方向。在Gemini項目內部,我們持續進行著架構創新和方法論實驗,這是推動進步的根本動力。
但同時,Google DeepMind和Google Research正在更廣闊的領域進行探索。有些前沿課題可能超出了當前Gemini項目的范疇,但這些探索至關重要。因為最終,Gemini代表的不是某個特定架構,而是我們構建通用智能的使命。技術架構會不斷演進,但追求智能的目標始終如壹。
人性的溫度:DeepMind如何保持“逆襲”心態
問:在谷歌I/O大會上,人們能感受到DeepMind團隊特有的人文關懷與溫暖,這種文化是如何被塑造和體現的?- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見