近十年來,深度偽造檢測技術一直圍繞著一個核心問題:給定一段影片或音訊片段,它是真實的還是合成的?商業檢測器透過分析像素、頻率和生物特徵訊號來回答這個問題,其中最好的檢測器在標準基準測試中表現出色。然而,在實際應用中,對於來自新型生成器的內容,其效能會急劇下降。
Vector 研究所的研究人員認為,這種差距是結構性的,要彌補這種差距,就需要重新思考該領域最初試圖檢測的是什麼。
審訊類比。傳統檢測著重於表面的媒體痕跡,而基於審訊的方法則評估言語行為的有效性、互動連貫性和操縱意圖,將檢測重點從感知分析轉移到交際結構和行為分析。
大語言模型基礎正在瓦解
目前的檢測器是基於五項技術假設。合成影像在與真實背景合成時會留下可見痕跡,生成模型會在影像的頻率成分中留下特徵指紋。視訊產生會產生幀間不一致,例如閃爍和身份漂移。合成肖像無法再現生物訊號,例如自然的眨眼模式和血液流動引起的微弱顏色變化。所有這些訊號都會在現實世界中透過壓縮、重新編碼和會議編解碼器進行傳輸時保留下來。
在基於生成對抗網路(GAN)的人臉替換技術盛行的年代,每個假設都基本上成立。但如今,這些假設都不再可靠,端到端擴散模型無需混合步驟即可產生完整的幀。現代視訊產生器能夠處理時間一致性,高解析度合成技術可以重現生理特徵。而最後一個假設——偵測器訊號能夠經得起Zoom、Teams等視訊會議軟體的傳輸,或經過重新編碼的社群媒體上傳——一直以來都是最缺乏驗證、也最脆弱的。
Vector Institute團隊將這種現象稱為「泛化錯覺」,基準測試得分很高,但實際偵測效能卻悄悄下降。
攻擊容易被抓住的地方
已記錄的深度偽造詐欺案例顯示出一致的模式。在2019年英國能源公司語音複製事件中,攻擊者複製了一位執行長的聲音,並指示一名高階主管向一家匈牙利供應商轉帳22萬歐元。後續電話引起了對該請求的懷疑,詐欺行為才得以發現。在2024年奧雅納(Arup)案例中,一名員工在一次涉及多名虛擬同事的深度偽造視訊會議中授權轉帳2550萬美元。幾週後,透過財務核對,詐欺行為才被發現。在另一起試圖冒充法拉利執行長的案件中,當目標高層提出一個只有真正的執行長才能回答的私人問題時,詐欺行為才被制止。
自動化媒體取證在這些結果中均未發揮作用。深度偽造攻擊之所以被發現,是因為人們注意到互動中存在一些異常之處,例如:不尋常的請求管道、違反制度規範以及缺乏共同的背景資訊。
另一個需要問的問題
研究論文提出增加一個專注於溝通本身的分析層面,它藉鑒了語言學和社會心理學的框架,而實踐版本則簡化為針對任何可疑互動提出的三個問題。
這個請求是否符合說話者的權威以及此類決定的正常語境?對話是否像真實的對話那樣自然流暢,還是存在一些微妙的偏差,例如過度預設腳本、閃爍其詞的回答以及突然轉換話題?互動中是否異常頻繁地堆砌了諸如營造緊迫感、聲稱權威以及訴諸社會認同等施壓策略?
這種通訊層分析與媒體取證並行進行。作者明確指出,它是媒體取證的補充而非替代,並承認該框架主要是研究方向。目前,訊號主要來自基於文字的網路釣魚和商業電子郵件入侵方面的研究,而將其擴展到即時音視訊環境則被列為一個開放性問題。他們還指出了一個邊界條件:如果攻擊者成功模擬了跨越所有三個通訊層的正常交互,則不會留下任何訊號,系統將僅依賴媒體取證。
實踐中哪些方法有效
在已記錄的案例中,有效阻止深度偽造詐欺的控制措施是程序性的。例如,對已知號碼進行回撥驗證、對高額轉帳進行帶外確認、提出挑戰性問題以及分離授權通道。這些建議雖然過時,難以直接整合到產品中,也無法用於引人入勝的演示。但它們之所以有效,是因為它們針對的是攻擊者利用的漏洞——互動過程,並且是在攻擊者無法合成的通道上進行的。
單獨使用深度偽造檢測技術正在失去優勢,而且隨著生成模型的不斷改進,這種優勢很可能會持續減弱。將其視為眾多訊號之一,並與用於識別媒體內容逼真度的程式控制措施相結合,才是更穩健的策略。
資料來源:https://www.helpnetsecurity.com/2026/05/15/research-deepfake-detection-limitations/