Deepfake 檢測技術面臨失效？研究指出傳統鑑識難敵生成式 AI 模型

2026.05.18

深度偽造檢測正逐漸被生成模型所取代

近十年來，深度偽造檢測技術一直圍繞著一個核心問題：給定一段影片或音訊片段，它是真實的還是合成的？商業檢測器透過分析像素、頻率和生物特徵訊號來回答這個問題，其中最好的檢測器在標準基準測試中表現出色。然而，在實際應用中，對於來自新型生成器的內容，其效能會急劇下降。

Vector 研究所的研究人員認為，這種差距是結構性的，要彌補這種差距，就需要重新思考該領域最初試圖檢測的是什麼。

審訊類比。傳統檢測著重於表面的媒體痕跡，而基於審訊的方法則評估言語行為的有效性、互動連貫性和操縱意圖，將檢測重點從感知分析轉移到交際結構和行為分析。

大語言模型基礎正在瓦解

目前的檢測器是基於五項技術假設。合成影像在與真實背景合成時會留下可見痕跡，生成模型會在影像的頻率成分中留下特徵指紋。視訊產生會產生幀間不一致，例如閃爍和身份漂移。合成肖像無法再現生物訊號，例如自然的眨眼模式和血液流動引起的微弱顏色變化。所有這些訊號都會在現實世界中透過壓縮、重新編碼和會議編解碼器進行傳輸時保留下來。

在基於生成對抗網路（GAN）的人臉替換技術盛行的年代，每個假設都基本上成立。但如今，這些假設都不再可靠，端到端擴散模型無需混合步驟即可產生完整的幀。現代視訊產生器能夠處理時間一致性，高解析度合成技術可以重現生理特徵。而最後一個假設——偵測器訊號能夠經得起Zoom、Teams等視訊會議軟體的傳輸，或經過重新編碼的社群媒體上傳——一直以來都是最缺乏驗證、也最脆弱的。

Vector Institute團隊將這種現象稱為「泛化錯覺」，基準測試得分很高，但實際偵測效能卻悄悄下降。

攻擊容易被抓住的地方

已記錄的深度偽造詐欺案例顯示出一致的模式。在2019年英國能源公司語音複製事件中，攻擊者複製了一位執行長的聲音，並指示一名高階主管向一家匈牙利供應商轉帳22萬歐元。後續電話引起了對該請求的懷疑，詐欺行為才得以發現。在2024年奧雅納（Arup）案例中，一名員工在一次涉及多名虛擬同事的深度偽造視訊會議中授權轉帳2550萬美元。幾週後，透過財務核對，詐欺行為才被發現。在另一起試圖冒充法拉利執行長的案件中，當目標高層提出一個只有真正的執行長才能回答的私人問題時，詐欺行為才被制止。

自動化媒體取證在這些結果中均未發揮作用。深度偽造攻擊之所以被發現，是因為人們注意到互動中存在一些異常之處，例如：不尋常的請求管道、違反制度規範以及缺乏共同的背景資訊。

另一個需要問的問題

研究論文提出增加一個專注於溝通本身的分析層面，它藉鑒了語言學和社會心理學的框架，而實踐版本則簡化為針對任何可疑互動提出的三個問題。

這個請求是否符合說話者的權威以及此類決定的正常語境？對話是否像真實的對話那樣自然流暢，還是存在一些微妙的偏差，例如過度預設腳本、閃爍其詞的回答以及突然轉換話題？互動中是否異常頻繁地堆砌了諸如營造緊迫感、聲稱權威以及訴諸社會認同等施壓策略？

這種通訊層分析與媒體取證並行進行。作者明確指出，它是媒體取證的補充而非替代，並承認該框架主要是研究方向。目前，訊號主要來自基於文字的網路釣魚和商業電子郵件入侵方面的研究，而將其擴展到即時音視訊環境則被列為一個開放性問題。他們還指出了一個邊界條件：如果攻擊者成功模擬了跨越所有三個通訊層的正常交互，則不會留下任何訊號，系統將僅依賴媒體取證。

實踐中哪些方法有效

在已記錄的案例中，有效阻止深度偽造詐欺的控制措施是程序性的。例如，對已知號碼進行回撥驗證、對高額轉帳進行帶外確認、提出挑戰性問題以及分離授權通道。這些建議雖然過時，難以直接整合到產品中，也無法用於引人入勝的演示。但它們之所以有效，是因為它們針對的是攻擊者利用的漏洞——互動過程，並且是在攻擊者無法合成的通道上進行的。

單獨使用深度偽造檢測技術正在失去優勢，而且隨著生成模型的不斷改進，這種優勢很可能會持續減弱。將其視為眾多訊號之一，並與用於識別媒體內容逼真度的程式控制措施相結合，才是更穩健的策略。

資料來源：https://www.helpnetsecurity.com/2026/05/15/research-deepfake-detection-limitations/

傳統的 Deepfake 媒體檢測技術正逐漸失效

回列表頁

CONTACT US

LOCATION