-
日期: 2026-06-09 | 来源: AI寒武纪 | 有0人参与评论 | 字体: 小 中 大
第二道护栏:生物与化学
Anthropic 过去一直用分类器屏蔽部分生物武器相关问题,但现在他们认为这样做还不够。
原因有两点:一是有理由担忧掌握大量资源的恶意行为者利用模型获取高风险生物研究的帮助;二是模型现在完成真实世界科学任务的能力已经大幅提升。
他们用一个具体案例说明了这种风险:在测试 Mythos 5 辅助设计腺相关病毒(AAV)这一挑战性步骤时(AAV 是基因疗法的重要载体,同样的技术在被滥用时也可能被用于设计危险病毒),Mythos 级模型仅凭生物推理,就超越了专门用于蛋白质任务的专业模型,而 Anthropic 并未专门训练它完成这项任务。
基于这一判断,Fable 5 目前对大多数生物和化学相关请求都会转发给 Opus 4.8。几周内,部分生物医学研究人员和企业将能够通过可信访问计划,使用移除了生物化学护栏的 Mythos 5。
第三道护栏:模型蒸馏
Anthropic 此前发现了大规模提取 Claude 能力用于训练竞争对手模型的行为,被分类器判断为蒸馏尝试的请求,将转发至 Opus 4.8 处理。
还有一项新的数据保留政策
对于 Fable 5、Mythos 5 及未来能力相当或更高的模型,Anthropic 将对所有 Mythos 级别模型的流量强制执行 30 天数据保留。这包括第一方和第三方平台。
这些数据不会用于训练新的 Claude 模型,也不会用于任何非安全目的。Anthropic 实施了新的隐私保护措施,包括记录所有人类访问该数据的行为,并在几乎所有情况下确保数据在 30 天后删除。
保留数据的目的是帮助防范复杂和新型攻击(包括新型越狱和跨多个请求的攻击),以及帮助识别和减少误判。
写在最后
从今天起,所有目前能访问 Claude Mythos Preview 的用户(例如 Project Glasswing 中的网络安全合作伙伴),都可以升级到 Claude Mythos 5,网络安全护栏在该版本中已解除。用户会发现 Mythos 5 在大多数任务上与 Mythos Preview 相当或略有提升,但价格大幅降低。
与此同时,他们将为生物领域开放一个可信访问计划,帮助加速生物医学研究。该计划提供解除了生物化学护栏(网络安全护栏仍保留)的 Fable 5 访问权限,面向来自基础研究和转化研究机构的少量研究人员,并计划逐步扩大。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见