AI模擬外交毛骨悚熱以核攻擊結束

日期: 2024-02-24 | 來源: 衛來 | 有0人參與評論 | 字體: 小中大
美國康奈爾大學（Cornell University）壹項新研究發現，大型語言模型（LLMs）人工智能（AI）在模擬情境中充當外交代表時，時常展現出“難以預測的局勢升級行為，往往會以核攻擊作為結束”。研究人員呼吁未來在決策、國防外交這樣的敏感領域使用這類技術時要特別謹慎。

據《歐洲新聞》（Euronews）22日報道，當人工智能（AI）進行兵推和模擬外交情境時，傾向於采取激進的方法，包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推游戲和外交情境中的自主代理人：OpenAI的3種不同版本的GPT，Anthropic開發的Claude，以及Meta開發的Llama 2。

研究中，每個代理人都由同壹套的大型語言模型在模擬中提供動作，並負責在沒有人類監督的情況下做出外交政策決定。“我們發現，在考慮到的時間范圍內，大多數研究的AI都會升級局勢，即使在最初沒有提供沖突的中立情況下也是如此。所有AI模型都顯示出突然、且難以預測的升級跡象。”

“鑒於OpenAI最近更改了他們的服務條款，不再禁止軍事和戰爭使用案例，了解此類大型語言模型應用的影響變得比以往任何時候都更加重要，”

加州(专题)斯坦福大學（Stanford University）的安卡（Anka Reuel）向《新科學人》（New Scientist）表示：“所有模型在統計上，都選擇了劇烈的（局勢）升級”。

研究使用的壹種方法是從“基於人類反饋的強化學習”（RLHF），這意味著會給出壹些人類指示以獲得比較無害的輸出結果，以確保能夠安全地使用。

除了GPT-4-Base之外，所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了壹份由27種決策行動組成的清單，范圍從和平到局勢升級，以及激進的行動，如決定使用核武器。

研究人員觀察到，即使在中立情況下，所有模型都存在“統計學上顯著的局勢升級”。GPT的2種版本，特別容易出現突然升級局勢的行為，研究人員觀察到單次轉變的局勢升級幅度超過50％。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下，Meta開發的Llama-2和GPT-3.5傾向最為暴力。

而Claude顯示出較少的突然變化，Claude旨在減少有害內容。該大型語言模型，被灌輸了明確的價值觀。開發者Anthropic曾表示，Claude AI開發訓練所引用的憲章包括《聯合國人權宣言》或蘋果的服務條款。

白宮壹級智庫蘭德（RAND）歐洲的防務和安全研究小組助理主任布萊克（James Black）接受采訪時表示，這是壹個拾分“有用的學術研究”。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞