-
日期: 2026-05-19 | 来源: 腾讯科技 | 有0人参与评论 | 专栏: 谷歌 | 字体: 小 中 大
作者声明:该图片由AI生成

图片由AI生成
北京时间5月20日凌晨,谷歌CEO Sundar Pichai在Google I/O 2026的舞台上算了一笔账,谷歌头部大客户每天可以处理约1万亿个token,如果把其中80%的工作负载从其他前沿模型切换到Google新发布的Gemini 3.5 Flash上,一年能省超过10亿美元。
2026年谷歌I/O大会的核心主线仍然是agent,从agent平台(Antigravity)到消费者 agent(Spark)到搜索agent,Google要把agent做成全栈能力。
在这场长达两小时的 Keynote 中,Google 发布了新一代 Gemini 3.5 系列模型、全模态世界模型Gemini Omni、第八代 TPU 双芯片架构,以及从编码工具升级为 agent 管理平台的Antigravity 2.0。
同时,我们也看到了一条新的主线变得更加清晰,Agentic AI时代已经走向中场,前沿模型的核心战场,也在从拼“最强最聪明”,转向了把agent 的运行成本压到企业敢大规模部署的门槛以下。
01 前沿智能+极致速度+一半价格?
谷歌这次发布了Gemini 3.5系列模型,打头阵的是当天就上线的Gemini 3.5 Flash。
过去几年,企业在用生成式AI时一直面临一个痛苦的抉择。最能干的模型,通常又大又慢,查询成本也高。反过来,那些更快、更便宜的模型,往往要牺牲准确性。
Gemini 3.5 Flash号称要改变这种局面。
皮查伊将它描述为谷歌内部的“游戏规则改变者”,用起来“令人难以置信的愉悦”。
他给出了一个直观的对比:Gemini 3.5 Flash的整体表现,全面超过了四五个月前还是谷歌顶级旗舰的Gemini 3.1 Pro。皮查伊的原话是:“Gemini 3.5 Flash比Gemini 3.1 Pro更好。它的性能能达到前沿模型的大约九成,速度快4倍,在Antigravity平台上甚至能快到12倍,而成本只有前者的三分之一到一半。”- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见