-
日期: 2025-11-05 | 来源: 极目新闻 | 有0人参与评论 | 字体: 小 中 大
拒绝关机,并非AI首次表现出的自主抗令行为。自2022年底爆火以来,AI模型多次表现出欺骗能力以及毫不掩饰的恶意。这些行为包括从普通的撒谎、欺骗和隐藏自身操纵行为,到威胁要杀死一位哲学教授,甚至威胁要窃取核密码和制造一场致命疫情。
研究人员补充道:“对于AI模型为何有时会拒绝关闭、为实现特定目标而撒谎或实施勒索等,我们无法给出有力解释,这种现状不容乐观。”
极目新闻综合参考消息、央广网等- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见