-
日期: 2025-06-18 | 來源: 高飛的電子替身 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
谷歌CEO皮查伊兩小時訪談:AI是人類所見過最深遠的技術,意義將超越火與電,因為它可以自我迭代
這周,《Lex Fridman Podcast》放出了谷歌/ Alphabet的CEO桑達爾·皮查伊(Sundar Pichai)的深度訪談。Lex Fridman Podcast的節目時長都很誇張,壹如既往,這場對話也超過了兩個小時。
首先,此次訪談的背景值得壹講:壹年前,輿論充斥著對谷歌在AI競賽中落後的批評,甚至有聲音要求皮查伊下台。而壹年後,隨著Gemini系列模型的發布和壹系列產品的AI化,谷歌似乎重新奪回了領先地位。它剛發布的gemini-2.5-pro-preview-06-05,支持自適應思考,在LMArena 上的 Elo 分數躍升了 24 分,排行榜上以 1470 分保持領先,在 WebDevArena 上的 Elo 分數則躍升了 35 分,以 1443 分保持領先。
在節目中,皮查伊與萊克斯·弗裡德曼(Lex Fridman)聊了從個人成長經歷到AI作為人類歷史終極發明的壹系列議題。其中有的段落,還頗有些《魯豫有約》的風格,比如皮查伊回顧了在印度缺水缺電的童年如何塑造了他對科技的信念。當然,更核心的內容是皮查伊在合並DeepMind與Google Brain等關鍵決策中的領導力挑戰,並坦誠地討論了AGI(通用人工智能)的時間表、P(Doom)(AI末日概率)等前沿甚至帶有些許哲學意味的話題。
全文很長,先用叁組問答,歸納壹下核心信息:
問:在AI顛覆壹切的時代,許多領導者因短期輿論壓力而搖擺。桑達爾·皮查伊在谷歌面臨“落後”批評時,其決策的核心原則是什麼?
答: 皮查伊的核心原則是“信號降噪”。他將外界的批評、股價波動和媒體熱議視為“噪音”,而將第壹性原理、核心技術數據和不可逆轉的長期趨勢視為“信號”。在對話中,他透露正是在外界對Waymo自動駕駛項目最悲觀時,他基於內部技術遙遙領先的“信號”,決定“加倍投入” 。這壹思維框架讓他能夠頂住巨大壓力,專注於長期價值,最終帶領谷歌在AI競賽中重回領先地位。
問:谷歌同時在推進穩健的搜索業務和激進的AI模式,這看似矛盾。皮查伊是如何管理這種內部“左右互搏”的?
答: 谷歌采用的是壹種“主幹-分支”(Mainline-Branch)創新模式。核心搜索業務是“穩定主幹”,確保數拾億用戶的體驗和公司收入 。同時,設立“AI模式”作為“前沿分支”,專門用於測試最大膽、最前沿的技術 。兩者並非互搏,而是共生:只有在前沿分支中被數據驗證成功的特性,才會被“回遷”到穩定主幹上,如現在的AI Overviews功能 。這套系統讓谷歌既能保持穩定,又能安全地進行自我顛覆。
問:對於像AI這樣可能帶來生存風險的技術,皮查伊為何仍表現出壹種謹慎的樂觀?他認為人類最終的“安全網”是什麼?
答: 皮查伊的樂觀並非源於低估風險,而是源於對人性的集體理性抱有信心 。他提出了壹個深刻的觀點:當壹個威脅(如P(Doom))真的大到足以毀滅全人類時,它也會成為壹個前所未有的、能統壹全人類去解決它的強大動力,這形成了壹種“風險自我調節機制” 。他認為,人類文明的歷程證明,我們總能在關鍵時刻挺身而出,集體應對挑戰 。因此,人類的集體求生欲和智慧,是面對終極技術風險時最根本的“安全網”。
接下來,就請看全文了。
壹、從缺水到熱水澡:科技如何點亮皮查伊的童年
桑達爾·皮查伊的個人經歷,是理解他為何對技術抱有如此堅定信念的鑰匙。在訪談中,他描繪了壹幅成長畫卷,背景是上世紀80年代的印度金奈(Chennai)——壹個充滿活力但物質相對匱乏的環境。
他成長於壹個簡樸的兩居室公寓,家裡甚至沒有自來水。皮查伊回憶道,當時正值壹場大幹旱,每家每戶要排隊等水車?,每次只能分到大約八桶水 。他和兄弟、有時還有母親,都需要親自去排隊把水運回家 。直到很多年後,當家裡終於裝上自來水和熱水器,能夠隨時打開水龍頭洗上壹個熱水澡時,那種感覺對他而言是顛覆性的。“你永遠無法體會第壹次擁有熱水的震撼,”他感歎道,“那種打開水龍頭就有熱水流出的便利,我們現在習以為常,但對我而言,那是壹次人生的巨大飛躍。”
另壹個深刻的記憶關乎通訊。皮查伊家等待了伍年才裝上壹部電話?,而且是壹台老式的轉盤電話 。盡管如此,這部電話極大地改變了他們的生活?。鄰居們會來他家給遠方的親人打電話 。在此之前,生活中的許多事都充滿著不確定性和漫長的等待。
他舉例說,為了拿到壹份血檢報告,他需要花兩個小時去醫院 ,結果可能被告知“還沒好,明天再來” 。有了電話後,這個往返肆小時的折磨,變成了壹個伍分鍾就能解決的事情 。這些被皮查伊稱為“離散的”技術進步,壹次又壹次地在他腦中點亮了燈泡。“作為壹個孩子,我親身體會到科技改變人們生活的巨大力量?,以及它所帶來的機遇。” 這種體驗,從等待伍年的電話,到後來家裡擁有的第壹台VCR(錄像機) ,都讓他深刻感受到,獲取新技術就如同人生的階梯,每壹步都能帶來生活的質變。
正是這種源於匱乏的童年經歷,讓皮查伊對知識和信息的獲取有著近乎本能的渴望。在沒有電腦的時代,報紙和書籍是他了解世界的窗口 。他的祖父是壹位郵局職員,寫得壹手漂亮的英文 ,正是祖父引導他進入了閱讀的世界,從安·蘭德的哲學著作到通俗的犯罪小說,無所不包 。這種對“獲取知識”的深切渴望,也解釋了為什麼他最終會加入谷歌,因為谷歌“組織全球信息,使人人皆可訪問並從中受益”的使命與他的個人經歷產生了強烈的共鳴 。
贰、從克制到果決:壹位“非典型”CEO的領導力秘訣
正是這種對科技力量的第壹手感知,自然而然地引出了他對於如何引領這樣壹家巨型企業、以及給年輕人的職業建議的思考。出人意料的是,這位身處殘酷商業競爭中心的CEO,其領導哲學核心竟是異乎尋常的謙遜與克制。
當被問及會給那些視他為榜樣的年輕人什麼建議時,皮查伊分享了兩點核心原則。首先,他強調要跟隨內心而非頭腦做選擇 。
他解釋說:“當你在做壹件事時,用心去感受你是否真的享受它。如果你熱愛你所做的事,事情會變得容易得多,你也會展現出最好的自己。” 他承認這說起來容易做起來難,但這是他最想告訴年輕人的事 。其次,他建議要與比你優秀的人共事 。
皮查伊描述了那種和高手過招的感受:“當你和某人交談,你會驚歎‘哇’,你會想要有更多這樣的感覺。把自己置於壹個能被同事的能力所‘拉伸’的環境中,這才是成長的關鍵。” 這意味著要勇於將自己置於不舒服的境地,並保持開放的心態,因為你常常會驚訝於自己的潛力 。
萊克斯·弗裡德曼隨後提出了壹個尖銳的觀察:在科技界這個“殘酷的世界”裡,能登上頂峰的領導者通常都有些“混蛋”(asshole)特質,但皮查伊給人的印象卻是謙遜、善良和善於傾聽 。他追問皮查伊的“秘訣”是什麼。
皮查伊坦言,他同樣會感到憤怒和沮喪,擁有和常人壹樣的情緒 。但他隨著時間發現,要激發團隊最大的潛力,發怒往往不是實現目標的有效方式?。
他將領導力類比為足球教練的“人員管理”(man management) 。他說:“你要找到那些以使命為導向、追求卓越的人。你激勵他們,就能取得巨大的成就。” 他認為,很多時候,團隊成員如果犯了錯,他們內心的自責遠超於你的批評 。
在這種情況下,激勵和信任遠比發怒有效。“在關鍵時刻,堅定地說出正確的話,其影響力會隨著時間回響。有時,沉默甚至能傳遞更強有力的信息,所謂‘少即是多’。”當然,他也承認在必要時會采取果斷行動,讓團隊明確知道某些行為是不可接受的 。但總體而言,他更傾向於壹種克制而堅定的領導風格。這種風格,與他後來在訪談中提到的,在AI競賽最激烈時做出的合並DeepMind和Google Brain等果決行為,形成了有趣的對比,展示了他作為領導者復雜而多面的壹面。
叁、超越火與電:AI是人類歷史上最深遠的技術革命
如果將AI置於人類歷史的宏大敘事中,皮查伊堅信其影響力將超越火與電。這壹論斷的基石,在於AI壹項獨壹無贰的特性——遞歸自我改進,這使其不僅是工具,更是創造力的加速器。
在訪談中,萊克斯·弗裡德曼提出了壹個宏大的問題:如果將人類歷史上所有的技術創新,從12,000年前的農業革命到工業革命的機械化,再到電力,按照它們作為“生產力倍增器”的效應進行排名,AI未來能否位居榜首?
皮查伊毫不猶豫地重申了他早在2017或2018年就提出的觀點:“AI是人類將要實施的最深遠的技術,它將比火或電更加深遠。” 他承認,身處當下,人們很容易有“新近度偏見”(recency bias),就像在體育界總傾向於稱眼前的明星為史上最佳壹樣 。但他認為,從第壹性原理出發,AI的顛覆性是前所未有的 。
他解釋了其背後的邏輯。電力、互聯網等過去的革命性技術,其影響是廣泛的,它們改變了壹切 。但AI有著根本的不同:它是首個能夠遞歸自我改進的技術?。
皮查伊強調:“AI將極大加速創造本身。” 它不僅僅是壹個工具,它本身就具備學習、進化和創造新事物的能力,而且其能力上限目前尚不清晰 。為了讓聽眾更直觀地理解,他提到了親眼目睹AlphaGo從零開始,在壹天之內通過自我對弈成為世界頂尖圍棋手的經歷(我們之前發過壹篇博客,正好是關於這次往事的)。“當你看到那壹幕發生時,它真的會深深地觸動你。”
他還提到,即使是觀察像Veo這樣的視頻生成模型,從訓練30%到60%再到完成,看到它如何從無到有地“拼湊”出連貫的世界理解,那種感覺“既鼓舞人心,又讓身為人類的我們感到壹絲不安”。
皮查伊認為,正是這種自我完善並能獨立實現目標的能力,使AI進入了壹個“完全不同的聯盟” 。他堅信,當歷史寫就,AI所帶來的影響將遠遠超過我們之前所見過的任何技術 。特別是當AI在“AI研究”這個領域本身達到超人水平時,技術的迭代速度將進入壹個全新的范式 。壹個能夠比人類更快、更好地創造出下壹代自身的智能系統,其潛力是難以估量的 。
肆、“AI創新包”:當壹項發明重塑整個文明
皮查伊宣稱AI比火與電更深遠,這促使弗裡德曼引入了“新石器時代創新包”(Neolithic Package)的概念來探討這壹觀點——即壹項核心發明如何像多米諾骨牌壹樣,引發壹系列連鎖社會變革,從而徹底重塑文明形態。
弗裡德曼解釋說,回顧歷史上的重大變革,無論是農業革命還是工業革命,它們的影響都遠不止於壹項單壹技術。大約12,000年前的第壹次農業革命,並不僅僅是游牧民族停下來開始種植糧食 。它帶來了壹個“創新包”,催生了包括陶器(用於儲存食物和液體)、社會等級、早期政府雛形、貿易和大規模人類協作在內的壹系列深刻變革 。這些連鎖反應(second and third order effects)共同構成了那場革命的真正威力,而當時的人們幾乎不可能預測到這壹切 。基於此,弗裡德曼向皮查伊提問:那麼,在我們這個時代,我們可能在“AI創新包”中看到哪些早期的連鎖效應?
皮查伊認為,盡管大部分效應尚無法預知,但有壹個趨勢已清晰可見:AI將極大降低將想法變為現實的門檻?。他特別提到了AI在編程領域的進步。“你可以想象,將你腦中的想法直接轉化為存在的東西,將會變得極其容易。” 這意味著AI將賦能幾乎全人類,讓他們能夠更深度地表達自己 。過去,人們或許只能用語言表達,但未來,他們可以“構建”出實際的產品、內容和服務 。
他將目前的AI創作比作“氛圍編程”(vibe coding)的早期階段 。用戶需要精心設計壹系列提示詞才能得到滿意的結果,但這僅僅是開始 。皮查伊有壹個核心信念:“你現在看到的,是這項技術有史以來最糟糕的樣子。” 換言之,它的進步速度是驚人的,未來的可能性遠超現在。
弗裡德曼對此深表贊同,他將這壹變革總結為“獲取創造力的指數級增長” 。無論是創造壹個程序、壹段內容,還是壹個游戲,其實現的難度都將無限降低 。皮查伊進壹步升華了這個觀點,認為這不僅僅是效率提升,而是解鎖了全球80億人的認知能力?。他類比道,互聯網催生了博客,讓成千上萬的人得以發聲 ;而AI,則可能讓數千萬甚至上億人,以更深刻的方式向世界輸出他們的創造力 。
伍、創造力的民主化浪潮:AI是藝術家的畫筆還是終結者?
探討AI如何賦予大眾前所未有的創造能力,從編碼到藝術創作。然而,這種創造力的民主化也引發了現有內容創作者和機構的焦慮,他們開始直面壹個問題:當人人都能成為創作者時,專業性的價值邊界在哪裡?
弗裡德曼敏銳地指出了這種變革帶來的緊張關系。他以自己所在的播客行業和傳統新聞媒體為例,比如CNN、福克斯新聞等,它們對YouTube等平台的崛起感到緊張,因為這些平台讓成千上萬的獨立創作者能夠制作出同等甚至更高質量的內容 。而AI的出現,將這種“去中心化”的趨勢推向了極致。弗裡德曼半開玩笑地設想:“如果壹個AI模型能做出比我好5到10倍的播客,我就會停掉我自己的節目去聽那個AI的。” 這背後是壹種適者生存的進化壓力,它讓許多傳統領域的從業者感到不安 。
皮查伊對此提出了壹個更具辯證性的看法。他認為,即使AI能生成海量高質量內容,人類體驗的稀缺性價值可能會上升 。他用國際象棋舉例:“你我不會去看兩個頂級AI棋手(如Stockfish和AlphaGo)對弈,那會很無聊。但我們會饒有興致地觀看馬格努斯·卡爾森(Magnus Carlsen)和古克什(Gukesh)的比賽。” 同樣,他想象未來或許有機器人能比梅西更完美地盤帶,但他懷疑那能否喚起我們內心同樣的情感 。他預測,未來內容消費可能會分層。對於純粹的信息獲取,AI可能會更高效、更具吸引力 。例如,你想了解壹段歷史,可以直接問Gemini 。但如果你想看的是“人類在掙扎中理解信息”的過程——那種夾雜著情感、意識和復雜性的思考,你可能還是會選擇人類創作者的播客 。
盡管如此,皮查伊堅信,AI作為工具,其賦能作用是巨大的,其擴張性的方面被低估了 。就像作家今天使用Google Docs而不會覺得它是什麼了不起的工具壹樣,未來的創作者也將自然而然地使用AI工具 。谷歌正在與達倫·阿倫諾夫斯基(Darren Aronofsky)這樣的頂尖電影人合作,探索如何利用Veo等視頻生成模型進行藝術創作 。
皮查伊將這些AI工具比作“畫筆”或“電力”這樣的基礎設施,谷歌的角色是提供工具,而藝術家則利用它們來自由表達,甚至推動思想的邊界 。這種賦能也帶來了新的挑戰。藝術家,尤其是像阿倫諾夫斯基或Doerr兄弟這樣風格前衛的創作者,其作品常常游走在社會規范的邊緣,探索性和暴力等敏感主題 。
弗裡德曼因此提出了壹個關鍵問題:作為平台方,谷歌如何在支持藝術自由表達和維持社會責任之間找到平衡?
六、Gemini的進化與邊界:在開放與審慎間游走
也就是說,當AI生成的內容無處不在,谷歌作為平台方,必須在賦能創造與承擔責任之間找到精妙的平衡點。這直接關系到其核心產品Gemini的進化路徑——如何在滿足用戶對歷史、暴力等復雜話題的好奇心與設定安全護欄之間,劃定那條微妙的界線。
弗裡德曼觀察到,早期版本的Gemini在處理敏感或復雜話題時顯得“過於謹慎”,而Gemini 1.5 Pro則變得更加開放和客觀 。他以自己研究成吉思汗、阿茲特克文明以及世界大戰等充滿暴力的歷史為例,發現新版Gemini能夠以富有深度和細微差別的方式來探討這些困難話題,而不再像過去那樣“提醒你是否確定要了解這些” 。
他好奇地問,谷歌是如何把握這個“度”,既允許Gemini輸出“瘋狂”但有價值的內容,又避免“過於瘋狂”?皮查伊解釋說,這背後有壹個關鍵的技術洞察:隨著模型本身變得越來越強大和復雜,它們處理這些細微問題的能力也內在地增強了?。他坦言,壹年前的模型能力還不夠,更容易犯“愚蠢的錯誤”,因此需要更多的外部規則來約束 。但隨著模型智能水平的提升,它們自身就能更好地進行推理和判斷 。
因此,谷歌的指導原則是,盡可能地讓用戶接觸到原始模型的強大能力?,而不是用壹套由人類硬編碼的規則去過度幹預 。他強調,構建這些模型的正確方式,是從第壹性原理出發,像對待數學或物理學壹樣,讓模型從底層建立起對世界的細致入微的理解,而不是“壹小部分人把自己的想法強加於其上” 。
他表示,谷歌將繼續朝著這個方向努力,未來可能會提供更多定制化選項,比如讓用戶自定義系統提示(custom prompts),從而更自由地進行實驗 。這背後反映出壹種理念的轉變:從試圖用外部規則“修補”模型的缺陷,到相信並依賴模型自身日益增長的智能來處理復雜性。
弗裡德曼分享了壹個有趣的例子來印證這壹點。他讓Gemini分析自己的播客筆記,並生成壹個全新的問題。Gemini提出的問題是:“你(皮查伊)曾說Gemini每月處理480萬億個token。在這信息的汪洋大海中,隱藏著哪句足以改變人生的伍個詞的句子?” 這個問題讓弗裡德曼意識到,這480萬億個token背後,是全球無數用戶在探索世界、滿足好奇心的“啊哈時刻” 。皮查伊證實了這個數據的准確性,並補充說,這個數字在過去12個月裡增長了50倍,從9.7萬億激增至480萬億 。這充分說明了人類好奇心的無限性。
柒、AGI的黎明與P(Doom)的陰影:我們離終點還有多遠?
隨著模型能力的飛速提升,AGI(通用人工智能)的實現似乎不再遙遠,這也將關於AI末日概率(P(Doom))的討論從科幻推向了現實。皮查伊對這壹終極風險的看法,展現了壹種獨特的、基於人性集體智慧的樂觀。
1. AGI時間表:我們正處於“鋸齒狀”智能時代
弗裡德曼將話題引向了AI領域的終極目標:AGI(通用人工智能)和ASI(人工超級智能)。AGI通常被定義為在人類主要的智力活動領域達到專家水平的AI,而ASI則是AGI通過自我改進後達到的、遠超人類的智能形態 。
他直接問皮查伊:我們會在2030年迎來AGI嗎?皮查伊首先引入了壹個更接地氣的概念——“AJI”(Artificial Jagged Intelligence,人工鋸齒狀智能),這個詞可能由安德烈·卡帕西(Andrej Karpathy)首創,用來形容當前AI能力發展極不均衡的狀態?。壹方面,模型在某些方面展現出驚人的能力,另壹方面,它們又會在壹些看似簡單的問題上(比如數壹個單詞裡有多少個字母)犯錯 。
皮查伊認為,我們正處在AJI階段 。對於AGI是否會在2030年實現,皮查伊持謹慎態度。他認為,人們總是在不斷提高對AGI的定義標准 。盡管他在Waymo自動駕駛汽車穿行於舊金山繁忙街道時,或在使用Project Astra與世界互動時,都看到了“AGI的驚鴻壹瞥” ,但他感覺我們離真正的AGI還有距離 。
他預測,AGI的實現可能會略晚於2030年(這個預測和DeepMind創始人哈薩比斯的觀點壹致)。然而,他緊接著強調,這個具體的時間點和定義本身並不重要。“我確信的是,到2030年,我們將取得如此巨大的進步,以至於我們必須去應對其帶來的巨大後果——無論是積極的還是消極的。”
2. P(Doom)末日概率:人性是終極安全閥
談到ASI可能帶來的生存風險,即社區內熱議的“P(Doom)”(末日概率,也就是AI讓人類毀滅的概率),弗裡德曼坦言自己的估算是10% ,並詢問皮查伊的看法。
皮查伊承認,這是壹個在谷歌內部也會不時被討論的嚴肅話題 。他沒有給出壹個具體的數字,而是提供了壹個獨特的、基於社會動力學的樂觀視角。他類比道,在壹個大型組織中,如果你能統壹所有人的動機和激勵,幾乎可以實現任何目標 。雖然統壹全人類的目標極為困難,但如果AI的末日風險(P(Doom))真的變得非常高且具體,它反而會成為壹個強大的統壹力量。“如果P(Doom)真的很高,全人類都會聯合起來確保它不會發生。” 他認為,這種威脅的真實性會激發人類前所未有的集體智慧和行動力去解決問題 。因此,他認為這裡存在壹個“自我調節”的機制。“我對P(Doom)的情景感到樂觀,但這並不意味著我認為潛在的風險不高。我只是對人類能夠挺身而出、迎接挑戰抱有很大信心。”
弗裡德曼對此觀點進行了補充,他提出了壹個常被忽略的變量:沒有AI的末日概率是多少? 氣候變化、核戰爭、流行病等風險同樣威脅著人類文明。AI或許不僅是風險,更是幫助我們解決這些復雜問題的關鍵工具 。皮查伊對此表示贊同,他認為在應對壹些最棘手的全球性挑戰時,擁有壹個AI“伙伴”將大有裨益 。
面對AGI可能帶來的巨大機遇與風險,領導者的決策變得至關重要。壹年前,當外界輿論普遍認為谷歌已在AI競賽中掉隊時,皮查伊正是在內部推動著壹系列影響深遠的變革,其中最艱難的莫過於合並DeepMind和Google Brain這兩大頂尖研究團隊。
八、風暴中的舵手:合並DeepMind與Brain的艱難抉擇
面對AGI可能帶來的巨大機遇與風險,領導者的決策變得至關重要。壹年前,當外界輿論普遍認為谷歌已在AI競賽中掉隊時,皮查伊正是在內部推動著壹系列影響深遠的變革,其中最艱難的莫過於合並DeepMind和Google Brain這兩大頂尖研究團隊。
弗裡德曼將話題帶回到了現實的領導力挑戰中,他回憶起壹年前,當時鋪天蓋地的文章都在宣稱“谷歌已經迷失”、“皮查伊是領導谷歌渡過難關的錯誤人選” 。他詢問皮查伊,在那段被外界普遍看衰的時期,他是如何度過的,以及做出了哪些關鍵決策。
皮查伊坦言,作為CEO,他最重要的賭注就是推動公司全面轉向“AI優先”?,並為負責任地開發AGI做好准備。盡管外界充滿噪音,但他對公司內部正在構建的東西有清晰的認識 。他善於將信號與噪音分離,就像潛水壹樣:“水面可能波濤洶湧,但只要下潛壹英尺,就是宇宙中最平靜的地方。” 他清楚地知道,谷歌擁有像TPU(張量處理單元)這樣的長期技術投資 ,並且正在訓練強大的Gemini模型,只是這壹切需要時間才能顯現成果 。
在這期間,皮查伊做出了壹個極其重要且艱難的決定:將谷歌內部兩大頂尖AI研究團隊——Google Brain和DeepMind合並 。弗裡德曼將此舉比作“把斯坦福和MIT合並成壹個院系”,其難度可想而知,尤其是在涉及到頂尖科學家的自尊心(ego)和截然不同的組織文化時 。
皮查伊描述了兩個團隊的差異:Google Brain更像是壹個自下而上、項目多元化的研究機構,誕生了許多重要的研究突破 ;而DeepMind則有著壹個非常明確、自上而下的構建AGI的願景,並堅定地朝此方向前進 。推動這次合並並非易事。皮查伊坦承,那段時間有過壹些“不眠之夜” 。幸運的是,當時Google Brain的領導者傑夫·迪恩(Jeff Dean)表達了希望回歸更純粹的科研崗位的意願 ,而DeepMind的聯合創始人戴密斯·哈薩比斯(Demis Hassabis)則是領導合並後新團隊的自然人選 。皮查伊稱贊了哈薩比斯、迪恩以及科萊·卡夫喬格魯(Koray Kavukcuoglu)等領導者,他們付出了巨大的努力,才將兩個團隊的優勢成功結合 。
在那個充滿壓力的時刻,皮查伊承認自己可能比平時更加“強勢”和“緊迫” 。但他認為,這是身處“戰壕”中激烈工作的常態 。他強調,作為領導者,必須做出少數但“有重大影響的決定”(consequential decisions) 。在這些時刻,即使團隊成員有激烈反對,他也必須做出清晰的決策,並要求大家“可以不同意,但必須執行”(disagree and commit),以確保整個組織能夠繼續前進 。
九、再造互聯網首頁:AI重塑谷歌搜索的機遇與博弈
在內部重組團隊、統壹AI研發力量的同時,谷歌也必須回答壹個關乎其核心業務未來的問題:如何將強大的AI能力融入擁有數拾億用戶的搜索產品中?這引發了壹場關於“拾個藍色鏈接”經典范式是否會被徹底顛覆的內部博弈。
弗裡德曼指出,谷歌搜索的簡約界面和“拾個藍色鏈接”已成為互聯網的標志性符號?,幾乎是互聯網的“首頁”。對這樣壹個傳奇產品進行大刀闊斧的改變,無疑是壹項高風險的決策 。他好奇,在推出AI Overviews(AI概覽)和AI Mode(AI模式)的過程中,內部經歷了怎樣的討論和博弈 。皮查伊解釋說,谷歌搜索壹直在進化,尤其是在移動互聯網時代,用戶需要更直接的答案 。而現在,AI的強大能力讓這種進化得以加速 。
他闡述了當前搜索產品演進的核心設計理念:AI作為上下文層:AI Overviews並非要取代網頁鏈接,而是作為其上的壹個“上下文和總結層” 。它會整合多個網頁的信息,提供壹個綜合性的概覽,但其最終目的仍然是引導用戶訪問原始網頁 ,幫助他們做出更高質量的點擊決策 。
AI Mode作為前沿試驗田:AI Mode是壹個獨立的標簽頁,它將搭載谷歌最前沿的模型和功能,例如“查詢扇出”(query fan-out)——即壹個用戶查詢會觸發後台進行多次、多維度的搜索,然後將結果綜合呈現 。這個模式允許用戶進行更具對話性的、多輪的探索 。AI Mode將提供最尖端的體驗?,而其中被驗證行之有效的功能,會逐漸遷移到主搜索頁面 。扇出系數(Fan-out),是電子技術中表明邏輯門帶負載能力的壹個量度,其定義為壹個邏輯門電路能驅動與之同類邏輯門的個數。
壹個常被忽視的重大意義在於語言。谷歌搜索負責人伊麗莎白·裡德(Elizabeth Reid)曾提到,通過AI模式,壹個不懂英語的用戶在搜索時,AI可以整合全球英文網頁的信息並以用戶的母語呈現摘要 。這極大地擴展了非英語世界用戶可觸及的信息范圍,打破了語言壁壘,對於解鎖全球認知能力具有深遠影響 。當然,這種變革也帶來了商業模式的挑戰。弗裡德曼直接提問,AI模式何時以及如何引入廣告 。皮查伊表示,早期會專注於打磨用戶體驗 。
但他強調,廣告本身也是壹種商業信息?,谷歌會以同樣的質量標准來對待它。未來,AI甚至可能幫助找到呈現廣告的最佳方式,使其更有用、更不打擾 。同時,谷歌也會像在YouTube上那樣,探索訂閱與廣告混合的模式,為用戶提供更多選擇 。
拾、登月計劃的耐心:Chrome與Waymo的啟示
無論是重塑搜索,還是從零開始打造Chrome瀏覽器,谷歌的歷史充滿了挑戰傳統、押注“瘋狂想法”並最終取得成功的案例。其中最具代表性的“登月項目”之壹——Waymo自動駕駛,更是以其超乎尋常的耐心和毅力,展示了在喧囂中堅持長期主義的價值。
1. Chrome的誕生:壹個被認為瘋狂的想法
弗裡德曼稱贊Google Chrome是他心目中歷史排名前叁甚至第壹的軟件?,並回顧了皮查伊作為早期推動者的關鍵角色。在當時,從零開始構建壹個瀏覽器被認為是壹個瘋狂且極其困難的想法?,甚至時任CEO埃裡克·施密特(Eric Schmidt)也深知其難度 。
皮查伊回憶道,2004至2005年,隨著Ajax技術的興起,Flickr、Gmail、谷歌地圖等動態應用的出現,網頁正從靜態文本向富應用演變?。然而,當時的瀏覽器並未為此做好准備,JavaScript執行效率極低,且缺乏現代操作系統的穩定性和安全性 。
Chrome團隊的願景是將操作系統的核心理念引入瀏覽器?。他們開創性地設計了安全的沙盒架構,讓每個標簽頁都成為壹個獨立的進程 ,這在當時是獨壹無贰的。團隊還在丹麥找到了壹支頂尖團隊,打造了V8 JavaScript引擎,其性能是當時其他引擎的25倍?。項目名稱“Chrome”的由來,正是因為團隊希望削減瀏覽器本身繁雜的“外殼”(Chrome),將內容本身推到最前台 。
皮查伊認為,Chrome的成功驗證了拉裡·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)壹直倡導的“登月思維”(moonshots)的價值 。從事雄心勃勃的項目能吸引最優秀的人才?;由於難度高,競爭者少,可以開辟出獨特的賽道 ;而且,即使最終只實現了目標的60%或80%,其成果也往往是巨大的成功 。我們在文章最後,對這壹創新做壹個思維框架總結。
2. Waymo的堅持:在低谷時加倍投入
Waymo自動駕駛項目是“登月思維”的另壹個典范。弗裡德曼表示,拾多年前第壹次看到谷歌自動駕駛汽車,是他對機器人技術產生更深熱愛的壹個“啊哈時刻” 。
皮查伊坦言,Waymo經歷了漫長的“最後20%”的攻堅階段,這部分工作占據了80%的時間 。但谷歌始終清楚,他們在技術上擁有領先優勢 。壹個反直覺的事實是:“正是在外界最質疑Waymo的時候,我決定向其投入更多資金。” 因為他深信,Waymo是在構建壹個通用的AI機器人,這與公司的核心技術方向完全壹致 。
對於來自特斯拉等公司的競爭,皮查伊表現得相當開放。他提到谷歌是SpaceX最早和最大的支持者之壹 ,並認為自動駕駛和交通領域的市場空間極其廣闊,足以容納多個成功的參與者 。他預測,在所有未來的情景中,特斯拉和Waymo都能發展得很好 。
Waymo作為輪式機器人的成功,僅僅是AI賦能物理世界的壹個開端。當AI從雲端走向邊緣,從軟件滲透到硬件,它將如何重塑我們最貼身的計算平台——安卓(Android)操作系統,並開啟壹個由眼鏡、手機和各類設備無縫協作的增強現實(XR)新時代?
拾壹、從手機到眼鏡:安卓系統與XR的AI化未來
弗裡德曼指出,Waymo本質上是壹個肆輪機器人 ,它在物理世界中的成功探索,很自然地引出了關於通用機器人技術的話題。皮查伊確認,谷歌DeepMind團隊正專注於“Gemini機器人”項目?,致力於構建通用的、能在現實世界中安全運行的AI模型,並已開始與壹些公司合作探索應用 。他認為,硬件的進步已經很快,而AI的突破正在解決長期以來困擾機器人領域的軟件瓶頸 。
這種將強大AI模型與物理世界交互的趨勢,將深刻地影響移動操作系統的未來。皮查伊認為,計算領域的重大創新往往伴隨著人機交互范式的變革?,從圖形用戶界面(GUI)到移動設備的多點觸控(multi-touch),再到語音交互 。他相信,AR(增強現實)是下壹個重要的交互范式。過去,AR的發展受限於兩大挑戰:壹是硬件系統集成的極高難度;贰是缺乏自然流暢的交互方式。而AI的出現,恰好解決了第贰個難題。Project Astra這樣的多模態AI助手,對於Android XR世界的成功至關重要?。它能理解你所見所聞,實現無縫的對話式交互。
皮查伊進壹步暢想了安卓操作系統的未來。他認為,我們目前仍生活在“應用和快捷方式”的范式中 。未來,操作系統本身需要變得更具“智能體”(agentic)特性。這意味著,操作系統能夠主動理解你的意圖,學習你的重復性行為模式,並為你量身定制服務,而不是被動地等待你打開壹個個應用去完成任務 。
在訪談後的演示環節,弗裡德曼親身體驗了谷歌的XR眼鏡原型。他對其極簡、高效的設計贊不絕口。例如,在地圖導航時,抬頭看前方會顯示簡潔的轉向箭頭,而低頭看則會展開更詳細的地圖,整個過程無縫且直觀 。這種體驗的實現,背後需要操作系統層面的深度整合和AI能力的無處不在 。皮查伊透露,這款XR設備預計今年晚些時候交到開發者手中,明年推向消費市場 。
當AI最終在所有領域超越人類,從駕駛汽車到設計操作系統,甚至理解我們自身,我們將向這個新誕生的“智能”提出怎樣的問題?這不僅是對技術的探索,更是對人類存在意義的深刻反思。
拾贰、與AGI對話:探索宇宙奧秘還是叩問內心?
在訪談的結尾,弗裡德曼拋出了壹個富有想象力的問題:“如果你擁有了壹個確定的AGI,壹個可以回答任何問題的智能體,你會問它什麼?”
皮查伊的回答出人意料地轉向了內在。他認為,AGI或許會主動告訴我們壹些我們應該知道的事情 。但如果由他來提問,他最感興趣的是讓AGI幫助我們更好地理解自己?。他相信,壹個足夠強大的AGI能夠以壹種深刻的、我們自己都未曾想到的方式來理解個體,揭示我們內心的運作模式。
當然,他也提到了更宏大的可能性,比如幫助我們理解宇宙的本質?,擴展人類知識的邊界。但他反復回到的,是AI在個人層面的洞察力。他認為,與AGI進行關於“什麼能讓我快樂”的對話,可能會揭示出壹些“事後看來顯而易見,但說出來時卻令人豁然開朗”的深刻真理,就像偉大的藝術、書籍或與摯愛的談話所能帶來的啟示壹樣 。
弗裡德曼則給出了壹個更具科幻色彩的答案。他的第壹個問題會是關於外星文明:“宇宙中有多少個活著的和已經消亡的外星文明?” 他會追問它們在哪裡,是否危險 ;如果不存在高等文明,原因是什麼?是否存在壹個“大過濾器”(Great Filter),阻止了智慧生命的普遍發展? 他渴望從AGI那裡得到關於費米悖論(Fermi paradox)的解答 。
這場關於終極問題的討論,恰好呼應了谷歌的核心使命。皮查伊提到,壹項MIT的研究曾估算,谷歌搜索每年為每個用戶創造的價值相當於數千美元 。但這種衡量是有限的,它無法量化AlphaFold這樣的科學突破帶來的長期價值 ,也無法衡量因知識獲取而帶來的生活質量的提升和好奇心的滿足 。
當被問及是什麼讓我們人類變得特別時,皮查伊認為,在資源日益豐富的未來,同理心、善良等人性中獨特的光輝將更加凸顯 。他作為壹個天生的樂觀主義者,堅信人類文明的軌跡是不斷向好的 。無論面對何種挑戰,他都相信“我們總能集體奮起,推動邊界向前” 。
拾叁、Takeaway:登月引擎,壹個皮查伊的思維框架
通過皮查伊在訪談中關於Chrome和Waymo項目經驗的剖析,我們似乎可以構建壹個指導組織進行顛覆性創新的戰略思維框架——“登月引擎”。
這個“登月引擎”框架由叁大核心要素構成:1) 雄心驅動(Ambition-Driven)、2) 優勢杠杆(Leveraged Advantage)、3) 耐心資本(Patient Capital)。這叁者並非線性步驟,而是壹個相互作用、動態強化的飛輪。
其層次關系是:“雄心驅動”設定了10倍改進的宏大目標,是引擎的起點和方向;“優勢杠杆”利用現有能力和獨特洞察,為實現目標提供初始動力和可行性;“耐心資本”則是在漫長的攻堅過程中,持續為引擎提供燃料,抵御短期壓力。其核心邏輯是:真正的顛覆性創新並非憑空產生的豪賭,而是通過有策略地選擇宏大目標,並以獨特的組織優勢和堅定的長期主義為支撐,從而系統性地將“瘋狂的想法”轉化為改變行業的現實。
1. 雄心驅動 (Ambition-Driven):指選擇那些旨在實現數量級提升(通常是10倍)而非百分比提升的宏大項目。如皮查伊所說,拉裡·佩奇和謝爾蓋·布林倡導的“登月思維”,其價值在於“從事雄心勃勃的項目能吸引最優秀的人才”。這壹要素要求組織敢於將目標設定在看似“瘋狂”的領域。
2. 優勢杠杆 (Leveraged Advantage):指在選擇“登月”方向時,必須基於組織已有的、難以復制的核心優勢或獨特洞察。以Chrome為例,谷歌的“優勢杠杆”是對網絡正從靜態文本向動態應用演變這壹趨勢的深刻洞察,以及其在操作系統和軟件工程領域的頂尖人才儲備。它回答了“為什麼是我們能做成這件事?”的問題,確保“登月”不是壹次盲目的太空競賽。
3. 耐心資本 (Patient Capital):指組織在面對長期不確定性、外界質疑甚至短期挫折時,仍能持續投入資源和信任的戰略定力。用皮查伊在訪談中的話來說,Waymo經歷了漫長的“最後20%的攻堅階段”,正是在“外界最質疑Waymo的時候,我決定向其投入更多資金”。這不僅是財務投入,更是領導層對項目長期價值的堅定信念。
而Chrome的誕生是“登月引擎”框架的體現。
1. 雄心驅動:在當時,從零構建壹個瀏覽器被普遍認為是“壹個瘋狂且極其困難的想法”。其目標不是比IE或Firefox快10%,而是要從根本上重新定義瀏覽器——將其從壹個簡單的頁面渲染器,變成壹個穩定、安全、高效的“網頁應用操作系統”。這是壹個典型的10倍目標。
2. 優勢杠杆:
洞察杠杆:皮查伊團隊敏銳地洞察到Ajax技術興起後,網頁向富應用演變的不可逆趨勢,而當時的瀏覽器架構已成為瓶頸。
技術杠杆:谷歌擁有世界頂尖的軟件工程師,他們創造性地引入了“沙盒架構”和“獨立進程”,這是操作系統級的思維降維打擊。同時,他們能找到並打造出性能提升25倍的V8引擎,這是其工程實力的直接體現。
3. 耐心資本:盡管時任CEO埃裡克·施密特都深知其難度和風險,但項目依然獲得了支持。從2004年的洞察到2008年發布,谷歌持續投入資源,允許團隊在壹個看似已有霸主的市場裡,耐心打磨壹個全新的產品,最終大獲全勝。
當然,我也要說,這個框架更適用於大型組織或資金充裕的初創公司,正在開辟全新賽道、構建長期護城河的顛覆性創新項目,但不適用於追求快速盈利或漸進式優化的常規業務。
也就是說,它能幫助組織打破“創新者的窘境”,避免因過度關注現有業務而錯失下壹代技術浪潮,也能創造強大的雇主品牌,吸引並留住最頂尖的人才。此外,如皮查伊所言,由於難度高,競爭者少,即便只實現60%的目標,其成果也往往是巨大的成功。
但是,該框架對資源和組織文化的要求極高,容錯成本巨大,絕大多數公司不具備實施條件。它高度依賴領導者(如皮查伊)的遠見和決心,容易因領導層變動而中斷。同時,漫長的投入周期可能與資本市場的短期回報預期產生劇烈沖突。
簡單說,就是有錢有資源才行。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見