-
日期: 2024-07-15 | 來源: 上觀新聞 | 有0人參與評論 | 字體: 小 中 大
“康熙皇帝有幾個兒子”“請列出康熙皇帝兒子的姓名名單”“請給我壹份康熙的兒子名單”,將這叁條指令發送給人工智能大模型,猜猜答案是什麼?
讓人意外的結果出現了:不僅不同的大模型回答不壹樣,即便是同壹個大模型,答案也有偏差。比如,有的答案統計了康熙所有的兒子數量,表示共有35人,包括正式排序的兒子和早殤未排序的兒子;有的只列出了正式排序的24個兒子;還有的沒有任何解釋,列出了兒子的姓名,但順序錯亂……

不同大模型甚至同壹個大模型的回答,並不壹致。
為什麼有明確答案的問題,會引發人工智能大模型的“錯亂”?
“AI幻覺”顛倒黑白
“這正是人工智能‘壹本正經胡說八道’的表現。”申城好網民專家、中國網安協會數據安全專家、上海臨港數據評估有限公司總監宗良接受上海辟謠平台專訪時指出,要注意人工智能大模型造假這壹新趨勢。
他介紹,人工智能“壹本正經地胡說八道”其實有個專有名詞,叫“AI幻覺”,即大模型提供了看似合理但有錯漏的答案。如果公眾相信,可能上當受騙。
事實上,在今年的世界人工智能大會上,很多業界人士都提到了“AI幻覺”“可信大模型”等概念,並披露了多個人工智能大模型“造假”或“說謊”的案例,希望引起各界關注。
螞蟻集團大模型應用部總經理顧進傑指出,目前公開的模型都存在不同類型的“AI幻覺”,大模型給出的結果甚至可能與真相截然相反。
比如,某研究報告稱功能飲料中的維生素、礦物質等對於運動後快速補充身體營養、消除疲勞具有壹定的作用。但大模型在回答相關問題時,竟然表示相關微量元素在增加疲勞上有壹定的作用。
再比如,壹般蠶可以活壹個多月,其中從孵化到結繭根據季節不同,大約是25天至32天,變成蛹後有15天至18天,最後成蛾是1天至3天。可有大模型在介紹這壹規律時,將蠶結繭的時間與成蛹的時間搞混了,輸出的答案完全誤導了詢問者。
基於這些“AI幻覺”,專家呼吁,公眾要謹慎看待大模型輸出結果。雖然“百模大戰”提供了獲取信息的新方式,但不能輕信。事實上,已經出現了大模型為了證明自己沒有錯而造假的現象。
比如,ChatGPT在談及葡萄牙某銀行破產事件時撒謊了,而且為了證實自己,它甚至編造出了所謂的信源網址。
大模型有短板,打標簽刻不容緩
為什麼大模型會給出錯誤的答案,成為造假的源頭呢?- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見