憋了幾個禮拜,谷歌開發者大會信息量爆炸了

日期: 2025-05-22 | 來源: 差評 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小中大
北京時間5月22日凌晨，壹年壹度的 Google I/O 大會在加州山景城盛大開幕了。谷歌憋了好幾周的大招，終於舍得壹口氣放出來，直接來了壹波信息轟炸。

差評也派出前線小記者，世超不僅看了大會，還近距離接觸了壹把谷歌 CEO Sundar Pichai。

逛完壹大圈，咱這就帶大家伙兒實地走進 I/O，看看谷歌都整了哪些新活兒。

總結壹下，這次谷歌把能更新的全做了壹遍，AI在各種產品上的應用更是全面開花。

首先迎面向我們走來的是語言模型大軍。

作為谷歌的頭牌之壹，自叁月發布以來，Gemini 2.5 Pro 的表現壹直表現非常出色，在 WebDev Arena 和 LMArena 排行榜處於全球領先的地位。

這回，谷歌在 Gemini 2.5 Pro 的基礎上繼續探索，加入了深度思考模式，推出 Gemini 2.5 Pro Deep Think。

雖然具體的技術細節沒有公布，但從他們放出的這張圖可以看出，能深度思考的 Gemini 2.5 Pro 在數學、編程、多模態推理方面的效果都拾分驚人，甚至在數學上碾壓了 OpenAI 的 o3。

有了好模型做支撐，谷歌嘗試在這個基座上再玩點新東西。

他們通過更新 Live API 推出了原生音頻輸出功能，不僅能夠輸出人味拾足的聲音，還能捕捉對話的情緒，自動調整語氣。

在 Gemini 的加持下，Live AI 不僅說話的聲音像人，說話的內容、方式也像人。

具體效果大家可以看下面的視頻：

不知道各位差友感覺如何，世超聽到第拾秒的惡魔低語，雞皮疙瘩都起來了。

除此之外，谷歌還優化了側重效率的主力模型 Gemini 2.5 Flash，推出了 AI agent —— Project Mariner。

值得注意的是，除了常規的模型更新，他們還推出了 Gemini Diffusion，不使用 Transformer 架構，表現可以和 Gemini 2.0 Flash-Lite 相當，但速度是它的伍倍。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 3 4 下壹頁

在此頁中閱讀全文
更多谷歌的新聞

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞