-
日期: 2025-11-19 | 來源: 澎湃新聞 | 有0人參與評論 | 字體: 小 中 大
像AI壹樣思考
Gemini不完美,但它答對了12道題。它是怎麼做到的?
將Gemini與ChatGPT進行橫向比較,可以觀察到,贰者在面對相同的視頻真偽判斷問題時,采用的分析路徑存在巨大差異——如果賦予模型以個性,那麼,ChatGPT就像是壹位端坐在實驗室中的檢測人員,動輒提視頻分辨率、幀率、總幀數、平均圖像銳度、噪聲水平和邊緣密度等技術名詞。而Gemini則像是壹名富有經驗的偵探,壹會兒考察畫面本身的細節,壹會兒核對視頻內容與外部資料能否交叉驗證,同時留心技術的傳播時間線,評估視頻制作的難度。
例如,在對壹段由Sora 2制作“日本民眾聲援日本首相高市早苗”的文生視頻進行分析時,ChatGPT根據“圖像邊緣平滑”“光照和陰影分布呈‘合成光’特征”“幀間連續性過於穩定”“畫面缺乏真實傳感器噪點結構”等技術維度,得出了視頻“經過後期合成或AI生成制作”的結論。而Gemini則從視頻中清晰可見的水印(並搜索了解了該水印的含義)、畫面上亂碼的文字和人物輕微扭動的非自然細節中“看”出了視頻“完全是由AI生成的”。
ChatGPT-5根據“圖像邊緣平滑”“光照和陰影分布呈‘合成光’特征”“幀間連續性過於穩定”“畫面缺乏真實傳感器噪點結構”等技術維度,得出了視頻“經過後期合成或AI生成制作”的結論。
Gemini從視頻中清晰可見的水印、畫面上亂碼的文字和人物輕微扭動的非自然細節中“看”出了視頻“完全是由AI生成的”。
在辨認另壹段展示了“伊朗海邊鲇魚被海浪沖上海岸後死亡”的真實視頻時,ChatGPT從光影壹致性、運動連續性、紋理與噪點分布、邊緣檢測與色彩統計和音視頻同步出發,做出了判斷。而Gemini則考慮了視頻畫面的壹致性、動態連續性、時間真實性與視頻的制作難度。
誠然,ChatGPT的技術分析路徑有其優勢,能夠發現人們使用肉眼難以察覺的異常細節。例如,在識別上述“美國女歌手泰勒·斯威夫特說中文接受訪談”的深偽視頻時,ChatGPT能夠通過聲紋分析和人物面部出現異常的塊狀偽影等技術特征,判斷出該視頻為深度偽造內容。而Gemini認為視頻中出現的音畫不同步只是在真實的視頻片段上增加了配音,判斷並不精准。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見