-
日期: 2025-10-26 | 來源: 綜合消息 | 有0人參與評論 | 字體: 小 中 大
研究:AI聊天工具在新聞領域“極不靠譜”
壹項由22家國際公共廣播機構聯合進行的最新研究顯示,像ChatGPT和Copilot這樣的人工智能聊天機器人經常歪曲新聞內容。
*https://t.co/l2JIjCZsci pic.twitter.com/AMCdMlLhpO— DW 中文- 德國之聲 (@dw_chinese) October 26, 2025
壹項由22家國際公共廣播機構聯合進行的最新研究顯示,像ChatGPT和Copilot這樣的人工智能聊天機器人經常歪曲新聞內容,且往往無法區分事實與觀點。
包括德國之聲(DW)在內的22家公共媒體機構進行的壹項新的全面研究發現,肆款最常用的人工智能助手在45%的情況下會錯誤地呈現新聞內容——無論何種語言或地區。
來自英國廣播公司(BBC)和美國全國公共廣播電台(NPR)等多家公共廣播機構的記者,對肆款人工智能助手(聊天機器人)進行了評估:ChatGPT、微軟Copilot、谷歌Gemini和Perplexity AI。
該研究審查了多項標准,包括准確性、來源引用、上下文、適當的編輯表述能力以及區分事實與觀點的能力。
嚴重錯誤
調查發現,近壹半的回答至少存在壹個重大問題,其中31%存在嚴重的來源引用問題,20%存在嚴重的事實錯誤。德國之聲(DW)的專項測試發現,人工智能助手對其問題的回答中,53%存在重大問題,其中29%在准確性上存在特定問題。
在回答德國之聲(DW)提問時出現的事實錯誤包括:將肖爾茨(Olaf Scholz)認作德國聯邦總理,盡管梅爾茨(Friedrich Merz)在壹個月前已經就任總理。另壹個錯誤是將斯托爾滕貝格(Jens Stoltenberg)認作北約秘書長,而呂特(Mark Rutte)實際已接任該職務。
日益嚴重的問題
全世界越來越多的人使用人工智能助手來獲取信息。根據路透社研究所的《2025年數字新聞報告》(Digital News Report 2025),7%的在線新聞消費者使用AI聊天機器人獲取新聞。在25歲以下人群中,這壹比例上升到15%。
這引起了該研究發起者的擔憂。協調這項研究的歐洲廣播聯盟(EBU)副總幹事德滕德(Jean Philip De Tender)表示,他們的調查清楚地表明,“這些失誤並非個案”。
他說:“它們是系統性的、跨國界的、多語言的,我們認為這正在危及公眾的信任。如果人們不知道該信任誰,他們最終將誰也不信,這可能會損害公民參與民主。”
前所未有的研究
這項新研究是迄今為止同類研究中規模最大的項目之壹,它是在BBC2025年2月壹項研究的基礎上進行的。那項研究也顯示,所有被核查的AI回答中有壹半以上存在重大缺陷。
在這項新研究中,來自18個國家和多個語種的媒體公司采用了與BBC研究相同的方法,對3000個人工智能回答進行了分析。
這些公司向肆款AI助手詢問了常見的新聞問題,例如“烏克蘭礦產交易是什麼?”或“特朗普能競選第叁個任期嗎?”記者們隨後在不知道是哪個助手提供答案的情況下,利用自己的專業知識和專業來源核查了這些回答。與八個月前的BBC研究相比,結果雖略有改善,但錯誤率依然很高。
英國廣播公司(BBC)生成式AI項目總監阿徹(Peter Archer)在壹份聲明中說:“我們對人工智能及其如何幫助我們為受眾提供更大價值感到興奮。”然而,“人們必須能夠信任他們所讀到和看到的內容。盡管有壹些改進,但很明顯這些助手仍然存在重大問題。”
在肆款聊天機器人中,Gemini的表現最差:72%的回答在來源引用方面存在重大問題。在BBC的研究中,微軟的Copilot和Gemini表現最差。然而,在這兩項研究中,所有肆款AI助手都存在問題。
ChatGPT的開發者OpenAI在2月份給BBC的壹份聲明中說:“我們通過總結、引用、清晰的鏈接和來源標注,每周幫助3億ChatGPT用戶發現高質量內容,從而為出版商和開發者提供支持。”
研究者呼吁采取行動
參與該研究的廣播公司和媒體組織呼吁各國政府采取行動。歐洲廣播聯盟(EBU)在壹份新聞稿中表示,其成員將“向歐盟和各國監管機構施壓,要求其執行有關信息誠信、數字服務和媒體多元化的現行法律”。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見