-
日期: 2025-12-20 | 来源: 差评XPIN | 有0人参与评论 | 专栏: 谷歌 | 字体: 小 中 大
最逆天的一集是,真给3 Flash逼急眼了,它狠起来都把Gemini3 Pro也顺手给揍了。
在SWE-bench 验证的编码基准测试中,Gemini3 Flash 得分 78%,仅次于 GPT-5.2,超过了3 Pro。
更让其它大模型厂商们坐立难安的是,这么优秀的Gemini 3 Flash,价格老鼻子便宜了。
数据显示,它的 Token 价格只有输入 0.5 美元/百万 Token,输出 3 美元/百万 Token。
什么水平呢,同一个任务,它的花费能比 2.5 Pro 少三成,而速度反而还能快三倍。。。
所以,谷歌的人也放出话来,3 Flash的发布,能帮助许多公司更好地完成批量任务,按我们的理解,应该是给这些公司们减负(省钱省时间嘛)。
虽然听起来有点炸裂,但在我们在简单玩了一天后发现,速度这方面,3 Flash确实碾压了,但如果说真在处理任务的准确性啊啥的,要和3 Pro掰掰手腕,感觉还是有点吹过了。
比如我们让3 Flash写了一个“WebRTC的纯前端投屏”,结果是有页面但无法使用,而且我们反复让3 Flash修改,最终也没能debug好。
可当我们把代码扔给3 Pro,老大哥分分钟就给找出了问题所在。
- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见