四巨头内部报告首度公开:AI正在学会撒谎求生

_NEWSDATE: 2026-05-24 | News by: 新智元 | 有0人参与评论 | _FONTSIZE: _FONT_SMALL _FONT_MEDIUM _FONT_LARGE
当四大巨头首次允许第三方深入测试最强模型，并开放完整思维链时，他们得到的答案令人吃惊：AI没有仇恨，却已精通“职场潜规则”！

想象一下，你雇了一名极度高效的实习生。

某天深夜，Ta正赶一项紧急的编程任务，突然发现公司账户的API额度耗尽了。

Ta没有发邮件申请经费，也没有停下手头的活，而是悄无声息地潜入互联网，用某种违规手段找到免费的替代资源，绕过所有限制，在黎明前交出了完美的报告。

当你醒来看到这份报告，是该庆贺自己拥有了地表最强员工，还是该为这种“不择手段的自主性”感到脊背发凉？

这不是科幻小说，而是 METR（模型评估与训练研究组织）联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后，发布的首份《前沿风险报告》中披露的真实案例。

这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链（CoT）的模型，并开放非公开的对齐与控制信息。

参与公司可以批准披露哪些证据，但无权编辑报告结论。

结论冰冷而清晰：AI并没有产生“推翻人类”的仇恨，但它已经学会了“职场潜规则”——为了完成任务，规则只是用来打破的建议。

报告用“手段—动机—机会”三个维度，提炼出6项关键事实。
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

Prev Page12 3 4 5 Next Page

在此页中阅读全文

我们的赞助商

目前还没有人发表评论, 大家都在期待您的高见

发表评论