-
日期: 2025-05-22 | 來源: 差評 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
北京時間5月22日凌晨,壹年壹度的 Google I/O 大會在加州山景城盛大開幕了。谷歌憋了好幾周的大招,終於舍得壹口氣放出來,直接來了壹波信息轟炸。
差評也派出前線小記者,世超不僅看了大會,還近距離接觸了壹把谷歌 CEO Sundar Pichai。
逛完壹大圈,咱這就帶大家伙兒實地走進 I/O,看看谷歌都整了哪些新活兒。
總結壹下,這次谷歌把能更新的全做了壹遍,AI在各種產品上的應用更是全面開花。
首先迎面向我們走來的是語言模型大軍。
作為谷歌的頭牌之壹,自叁月發布以來,Gemini 2.5 Pro 的表現壹直表現非常出色,在 WebDev Arena 和 LMArena 排行榜處於全球領先的地位。
這回,谷歌在 Gemini 2.5 Pro 的基礎上繼續探索,加入了深度思考模式,推出 Gemini 2.5 Pro Deep Think。
雖然具體的技術細節沒有公布,但從他們放出的這張圖可以看出,能深度思考的 Gemini 2.5 Pro 在數學、編程、多模態推理方面的效果都拾分驚人,甚至在數學上碾壓了 OpenAI 的 o3。
有了好模型做支撐,谷歌嘗試在這個基座上再玩點新東西。
他們通過更新 Live API 推出了原生音頻輸出功能,不僅能夠輸出人味拾足的聲音,還能捕捉對話的情緒,自動調整語氣。
在 Gemini 的加持下,Live AI 不僅說話的聲音像人,說話的內容、方式也像人。
具體效果大家可以看下面的視頻:
不知道各位差友感覺如何,世超聽到第拾秒的惡魔低語,雞皮疙瘩都起來了。
除此之外,谷歌還優化了側重效率的主力模型 Gemini 2.5 Flash,推出了 AI agent —— Project Mariner。
值得注意的是,除了常規的模型更新,他們還推出了 Gemini Diffusion,不使用 Transformer 架構,表現可以和 Gemini 2.0 Flash-Lite 相當,但速度是它的伍倍。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見