-
日期: 2025-05-18 | 來源: 極客公園 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
人類對知識的征途,或許才剛剛開始。
去年,AI 能解出博士級別的數學題,已是轟動壹時的大新聞;而今年,能攻克「未解之謎」級別的數學難題的 AI 已經來了。
5 月 15 日,Google DeepMind 發布了全新編程智能體 AlphaEvolve。
不同於傳統的編程 Agent,它專注於通用算法的自動發現與持續優化。顧名思義,AlphaEvolve 擅長在「進化」中尋找更優解,它模擬自然選擇機制,能在代碼中不斷迭代、演化出創新算法。
只要問題能用程序表達、結果能用函數評估,AlphaEvolve 就能迭代算法。Google 表示,在組合數學、幾何學、數論等超過 50 個未解問題中應用後,AlphaEvolve 在約 20% 的問題上超越了人類現有解法。
DeepMind 研究員 Matej Balog 表示:「AlphaEvolve 在拾多個公開的數學問題上取得了突破。但最讓我激動的是:它找到了 56 年以來,4x4 復數矩陣乘法算法的首次改進。這個結果,來自它自創的壹種復雜搜索算法。」
AlphaEvolve 的價值不僅在數學,它展現出的是壹種通用的「算法發現能力」。Balog 表示:「我們對 AlphaEvolve 的應用,還只是觸及表層。」
01
問題能用程序表達、結果能用函數評估,
AlphaEvolve 就能迭代算法
Google DeepMind 表示,AlphaEvolve 能夠在多個復雜問題中取得突破,關鍵在於其背後運作的是壹整套自動進化機制,能持續優化算法並提升性能。
從本質上看,AlphaEvolve 解決的是壹個通用的黑盒優化問題:maximize h(f)。其中,f 是由大型語言模型生成的程序,h 是衡量該程序質量的評估函數。
在實際流程中,AlphaEvolve 首先通過提示采樣器(prompt sampler)組裝提示詞,引導語言模型生成代碼。DeepMind 使用了兩個不同的 Gemini 模型協同工作:Gemini Flash 以更高速度生成大量候選方案,擴展思路的廣度;Gemini Pro 則提供更深入的結構性建議。贰者結合,使模型能產出具備實際可行性和算法深度的程序。
生成的程序會被送入自動評估系統,經過驗證、運行和打分後,寫入程序數據庫。數據庫中運行著壹套進化算法,會從已有程序中挑選表現最好的方案,為下壹輪提示提供方向,不斷迭代出更優解。
AlphaEvolve 的壹個核心點就是這套自動評估指標。它能對生成程序進行驗證、運行和評分。每壹個程序都會被 h 函數衡量其准確性、運行效率、代碼質量等維度。這些評分標准是客觀、量化的,使 AlphaEvolve 能夠在無需人類直接幹預的前提下持續優化。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見