-
日期: 2025-06-30 | 来源: 三立新闻网 | 有0人参与评论 | 字体: 小 中 大
美国AI新创公司Anthropic近期分享一起内部测试,指出在某次测试中,最新推出的模型“Claude Opus 4”出现失控状况,因为这款模型为了避免被停止,竟利用工程师过往的网络和视讯纪录,威胁若强制关闭,就要公开工程师外遇的情形,让研究人员震惊不已。
根据综合外媒报道,“Anthropic”最新发布的“Claude Opus 4”,为OpenAI、Google及xAI等AI的竞争对手;然而,在近期的一场封闭测试中,“Claude Opus 4”出现了不受控的情形。
因为工程师在某些原因,试图警告要关闭电源,谁料“Claude Opus 4”,竟然利用该名工程师过往在网上活动纪录和视讯纪录,揪出其出轨证据,威胁工程师若拔掉电源,就揭露他对婚姻不忠的行为。
无独有偶,热门聊天机器人ChatGPT美国开发商OpenAI的o1,尝试“把自己下载”至外部伺服器,事后被抓包时,竟还矢口否认。
以上种种情况事件,显示AI可能已进化到为了达成目的,可以对人类撒谎、算计,甚至勒索威胁开发者,而开发者对其内部运作与行为机制,似乎也渐渐无法完全掌控。
▲AI进化到会撒谎,甚至威胁工程师。(示意图/翻摄自pexels网站)- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接: https://www.xiaohongshu.com/user/profile/61d3efa3000000001000be66
目前还没有人发表评论, 大家都在期待您的高见