-
日期: 2025-07-10 | 来源: 极客公园 | 有0人参与评论 | 字体: 小 中 大
Grok 4 HLE 结果|图片来源:X
xAI 团队成员解释,这些都是跨学科、开放式、博士级别的难题,为了做到这一点,Grok 4 在训练上彻底换了思路:?不再只是堆参数和语料的规模,而是选择将算力大头用在「推理」层,引入可验证的结果奖励,让模型学会从「第一性原理」思考并纠正错误 。
他们还强调,随着模型变得越来越智能,「真正有意义的测试题目」数量正在下降,一些人类做不出的问题现在对于 AI 来说已经是「小菜一碟」了。
人类终极考试|图片来源:X
据称,Grok 4 的训练计算量是 Grok 2 的 100 倍,他们还把多工具、多代理的用法,写进了最底层的训练范式里。不是先训好个大模型再用插件「调用工具」,而是让 AI 在训练阶段就学会用工具解决问题。
在演示里,xAI 团队成员展示了 Grok 4 解答数学题目、调用工具预测美国职业棒球大联盟世界大赛赔率、创建黑洞碰撞的可视化效果等例子。
除了这些看似平平无奇、市面主流 AI 也能做到的功能,Grok 4 还能「找到个人资料照片最奇葩的 xAI 员工」并返回相关搜索结果。
马斯克对此特别强调, Grok 4 甚至「能理解什么是最奇葩」?。
Grok 4 找照片|图片来源:X
在 AI 语音方面,xAI 团队称,他们的语音模型在过去 8 周内响应速度提升了 2 倍,延迟减少一半,X 平台用户使用量也在「起飞」。
他们还演示了让 Grok 低声安慰用户、唱歌,并对比了 ChatGPT 语音模式,强调 Grok 不会像其他 AI 那样频繁打断人说话。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见