研究:AI聊天工具在新聞領域"極不靠譜"

日期: 2025-10-26 | 來源: 綜合消息 | 有0人參與評論 | 字體: 小中大
研究：AI聊天工具在新聞領域“極不靠譜”

壹項由22家國際公共廣播機構聯合進行的最新研究顯示，像ChatGPT和Copilot這樣的人工智能聊天機器人經常歪曲新聞內容。

*https://t.co/l2JIjCZsci pic.twitter.com/AMCdMlLhpO— DW 中文- 德國之聲 (@dw_chinese) October 26, 2025

壹項由22家國際公共廣播機構聯合進行的最新研究顯示，像ChatGPT和Copilot這樣的人工智能聊天機器人經常歪曲新聞內容，且往往無法區分事實與觀點。

包括德國之聲（DW）在內的22家公共媒體機構進行的壹項新的全面研究發現，肆款最常用的人工智能助手在45%的情況下會錯誤地呈現新聞內容——無論何種語言或地區。

來自英國廣播公司（BBC）和美國全國公共廣播電台（NPR）等多家公共廣播機構的記者，對肆款人工智能助手（聊天機器人）進行了評估：ChatGPT、微軟Copilot、谷歌Gemini和Perplexity AI。

該研究審查了多項標准，包括准確性、來源引用、上下文、適當的編輯表述能力以及區分事實與觀點的能力。

嚴重錯誤

調查發現，近壹半的回答至少存在壹個重大問題，其中31%存在嚴重的來源引用問題，20%存在嚴重的事實錯誤。德國之聲（DW）的專項測試發現，人工智能助手對其問題的回答中，53%存在重大問題，其中29%在准確性上存在特定問題。

在回答德國之聲（DW）提問時出現的事實錯誤包括：將肖爾茨（Olaf Scholz）認作德國聯邦總理，盡管梅爾茨（Friedrich Merz）在壹個月前已經就任總理。另壹個錯誤是將斯托爾滕貝格（Jens Stoltenberg）認作北約秘書長，而呂特（Mark Rutte）實際已接任該職務。

日益嚴重的問題

全世界越來越多的人使用人工智能助手來獲取信息。根據路透社研究所的《2025年數字新聞報告》（Digital News Report 2025），7%的在線新聞消費者使用AI聊天機器人獲取新聞。在25歲以下人群中，這壹比例上升到15%。

這引起了該研究發起者的擔憂。協調這項研究的歐洲廣播聯盟（EBU）副總幹事德滕德（Jean Philip De Tender）表示，他們的調查清楚地表明，“這些失誤並非個案”。

他說：“它們是系統性的、跨國界的、多語言的，我們認為這正在危及公眾的信任。如果人們不知道該信任誰，他們最終將誰也不信，這可能會損害公民參與民主。”

前所未有的研究

這項新研究是迄今為止同類研究中規模最大的項目之壹，它是在BBC2025年2月壹項研究的基礎上進行的。那項研究也顯示，所有被核查的AI回答中有壹半以上存在重大缺陷。

在這項新研究中，來自18個國家和多個語種的媒體公司采用了與BBC研究相同的方法，對3000個人工智能回答進行了分析。

這些公司向肆款AI助手詢問了常見的新聞問題，例如“烏克蘭礦產交易是什麼？”或“特朗普能競選第叁個任期嗎？”記者們隨後在不知道是哪個助手提供答案的情況下，利用自己的專業知識和專業來源核查了這些回答。與八個月前的BBC研究相比，結果雖略有改善，但錯誤率依然很高。

英國廣播公司（BBC）生成式AI項目總監阿徹（Peter Archer）在壹份聲明中說：“我們對人工智能及其如何幫助我們為受眾提供更大價值感到興奮。”然而，“人們必須能夠信任他們所讀到和看到的內容。盡管有壹些改進，但很明顯這些助手仍然存在重大問題。”

在肆款聊天機器人中，Gemini的表現最差：72%的回答在來源引用方面存在重大問題。在BBC的研究中，微軟的Copilot和Gemini表現最差。然而，在這兩項研究中，所有肆款AI助手都存在問題。

ChatGPT的開發者OpenAI在2月份給BBC的壹份聲明中說：“我們通過總結、引用、清晰的鏈接和來源標注，每周幫助3億ChatGPT用戶發現高質量內容，從而為出版商和開發者提供支持。”

研究者呼吁采取行動

參與該研究的廣播公司和媒體組織呼吁各國政府采取行動。歐洲廣播聯盟（EBU）在壹份新聞稿中表示，其成員將“向歐盟和各國監管機構施壓，要求其執行有關信息誠信、數字服務和媒體多元化的現行法律”。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞