Gemini對陣ChatGPT,誰能辨出12段視頻真假?

日期: 2025-11-19 | 來源: 澎湃新聞 | 有0人參與評論 | 字體: 小中大
像AI壹樣思考

Gemini不完美，但它答對了12道題。它是怎麼做到的？

將Gemini與ChatGPT進行橫向比較，可以觀察到，贰者在面對相同的視頻真偽判斷問題時，采用的分析路徑存在巨大差異——如果賦予模型以個性，那麼，ChatGPT就像是壹位端坐在實驗室中的檢測人員，動輒提視頻分辨率、幀率、總幀數、平均圖像銳度、噪聲水平和邊緣密度等技術名詞。而Gemini則像是壹名富有經驗的偵探，壹會兒考察畫面本身的細節，壹會兒核對視頻內容與外部資料能否交叉驗證，同時留心技術的傳播時間線，評估視頻制作的難度。

例如，在對壹段由Sora 2制作“日本民眾聲援日本首相高市早苗”的文生視頻進行分析時，ChatGPT根據“圖像邊緣平滑”“光照和陰影分布呈‘合成光’特征”“幀間連續性過於穩定”“畫面缺乏真實傳感器噪點結構”等技術維度，得出了視頻“經過後期合成或AI生成制作”的結論。而Gemini則從視頻中清晰可見的水印（並搜索了解了該水印的含義）、畫面上亂碼的文字和人物輕微扭動的非自然細節中“看”出了視頻“完全是由AI生成的”。

ChatGPT-5根據“圖像邊緣平滑”“光照和陰影分布呈‘合成光’特征”“幀間連續性過於穩定”“畫面缺乏真實傳感器噪點結構”等技術維度，得出了視頻“經過後期合成或AI生成制作”的結論。

Gemini從視頻中清晰可見的水印、畫面上亂碼的文字和人物輕微扭動的非自然細節中“看”出了視頻“完全是由AI生成的”。

在辨認另壹段展示了“伊朗海邊鲇魚被海浪沖上海岸後死亡”的真實視頻時，ChatGPT從光影壹致性、運動連續性、紋理與噪點分布、邊緣檢測與色彩統計和音視頻同步出發，做出了判斷。而Gemini則考慮了視頻畫面的壹致性、動態連續性、時間真實性與視頻的制作難度。

誠然，ChatGPT的技術分析路徑有其優勢，能夠發現人們使用肉眼難以察覺的異常細節。例如，在識別上述“美國女歌手泰勒·斯威夫特說中文接受訪談”的深偽視頻時，ChatGPT能夠通過聲紋分析和人物面部出現異常的塊狀偽影等技術特征，判斷出該視頻為深度偽造內容。而Gemini認為視頻中出現的音畫不同步只是在真實的視頻片段上增加了配音，判斷並不精准。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁 1 234 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞