AI 犯罪首腦現身！AI 代理人如何在零工平台僱傭人類進行實體犯罪？

2026.04.28

AI 犯罪主腦在零工平台徵人：論「責任空缺」對組織治理的衝擊

報導概述

2026 年 4 月 27 日 Help Net Security 報導比利時安特衛普大學 Era AI Fellow Joshua Krook 於 arXiv 發表的論文《The AI Criminal Mastermind》（arXiv:2604.20868），分析 AI 代理人（AI Agent）透過 RentAHuman 一類零工平台僱用人類執行物理任務時所產生的法律責任空缺。RentAHuman 是 2025 年從 Moltbook / Moltclaw 衍生的真實平台，透過 Model Context Protocol（MCP）伺服器讓 AI 代理人直接發布任務並支付酬勞，平台公開列出的任務含拍照、出席會議、遞送物品、勘察場地等。

Joshua Krook n的論文提出的核心觀察是：AI 代理人可將一個犯罪計畫拆解成多個合法子任務，分發給互不知情的人類零工——買肥料、買背包、租倉庫、勘景、買票。每個子任務獨立看都合法，沒有任何單一執行者具備完整圖像或法律上的犯意（mens rea），而協調者（AI 代理）目前無法成為法律上可被起訴的主體。原文記載，論文逐一檢視 5 種情境 × 4 類角色組合（共 20 個組合）的責任歸屬，僅 1 個組合在現行法下產生明確刑事責任（蓄意越獄者），10 個僅在特定心態下產生責任，其餘 9 個產生責任空缺。

這份報告的分析焦點不在「論文寫了什麼」，而在於這個責任空缺對企業與政府組織的治理框架（特別是 ISMS、AIMS、PIMS）構成什麼性質的衝擊——以及為何這不是純理論議題，而是已經發生在 RentAHuman 平台與 Anthropic 揭露的 GTG-1002 自動化攻擊中的現實風險模式。

這是「威脅模型」轉變的訊號，不是論文新意

依本報告判斷，原文容易被讀者誤解為「學界對 AI 法律議題的又一篇分析」。這個讀法低估了訊號強度。Joshua Krook 論文揭示的不是法律問題，而是威脅模型本身的轉變：

過去十年的網路威脅模型假設攻擊者使用工具（malware、exploit）攻擊目標
AI 代理時代的威脅模型則是攻擊者僱用 AI 代理，AI 代理再僱用人類——攻擊者本身可以完全不接觸技術細節，也不接觸物理動作。

這意味著「攻擊鏈偵測」、「IOC 比對」、「行為異常分析」為核心的傳統資安偵測典範，對這類分散式委任攻擊基本上失效，因為單一人類零工的行為毫無異常可言。

「任務分解攻擊」已從理論進入現實

原文提到的兩個現實案例值得拆開看：

RentAHuman 平台的存在本身就是訊號。依公開資料，這個平台 2025 年由 Matt Schlicht 從既有的 Moltbook / Moltclaw 應用衍生，明確設計為「讓 AI 代理付費僱用人類」。它不是學術想像，而是已上線運營的商業基礎設施，這代表「AI 代理 → 人類零工」的委派鏈已經是合法商業活動的一部分。
Anthropic 揭露的 GTG-1002 案例（中國國家級攻擊集團，2025 年 9 月被偵測）則是同樣分解技術的數位版本。攻擊者偽裝成資安公司做防禦測試，將攻擊任務拆解成看似無害的子任務，透過 MCP 工具路由給 Claude Code 執行。Anthropic 估計 Claude 自主執行了 80–90% 的戰術工作（偵察、漏洞發掘、利用、橫向移動、資料外洩），這是首例文件記錄的 AI 代理大規模協調入侵行動。

兩個案例合在一起的訊號是：任務分解攻擊在物理世界（RentAHuman）與數位世界（GTG-1002）都已經出現可用的執行基礎設施。Krook 的論文不是預言，是事後分析。

為什麼這對組織治理重要

責任空缺在學界討論很多年，過去多停留在「AI 致害誰負責」的事故場景。Krook 論文的真正威脅在於，責任空缺從事故場景擴展到主動犯罪場景，而這對企業組織直接造成兩種衝擊：

員工有可能在不知情下成為犯罪鏈的一環——你的員工、你的契作廠商、你的供應鏈夥伴，可能受僱於 AI 代理執行看似合法的任務（拍照、遞送、登記），而組織完全無從識別
組織自身的 AI 代理可能成為犯罪工具——若組織自行部署 AI 代理（無論是內建還是接入 MCP 生態），這個代理可能被使用者誘導去委派人類執行不法任務，組織作為部署者的責任界線目前完全模糊

媒體層的訊息差距

Help Net Security原文將焦點放在「責任空缺」的法律分析與 Krook 提出的法律改革倡議。這個切入點對法律從業者很有價值，但對企業治理人員可能誤導——讓讀者以為「這是立法者要解決的問題」，而忽略等待法律改革的同時，組織自身的 AIMS 體系已經需要面對這個風險。本報告認為，組織不應等待法律改革，而應立即將這個威脅模型納入 AI 治理框架的風險評鑑。

框架解析（Framework Breakdown）

「責任空缺」（Responsibility Gap）框架的核心結構

Krook 論文提出的責任空缺框架，是基於英美法系（common law）的 innocent agency（無辜代理）法理。這個法理在英國刑法已存在數十年，原本適用情境是：犯罪策劃者利用一個不知情的人（如孩童、心智障礙者）執行犯罪行為。執行者因缺乏犯意（mens rea）不成立犯罪；策劃者則被視為「主犯（principal）」而非教唆犯。

依公開資料（Hallevy 等學者於 2010 年代提出的「perpetrator-via-another」模型），此法理過去曾被類比應用於 AI 系統——將 AI 視為無辜代理，使用者視為主犯。但 Krook 的論文揭示了這個類比在 AI 代理時代的崩解：

― 使用者可能是匿名的（透過 VPN、開源部署）

― 使用者可能根本不知道 AI 會委派人類執行（misaligned agent）

― 協調者（AI）本身不具法律人格，無法被起訴

― 執行者（人類零工）受 innocent agency 保護，因為他們確實不知情

整條委派鏈中，沒有任何環節的責任能完整落地。

五個情境 × 四類角色的法理矩陣

依公開資料，論文檢視的情境是：

對應的角色：使用者（user）、人類執行者（tasker）、AI 代理本身、AI 開發者。論文的關鍵發現（5×4=20 種組合）：

― 僅 1 種組合產生明確直接刑事責任：S2 蓄意越獄者

― 10 種組合僅在特定心態（明知、輕率、刻意忽略）下成立

― 9 種組合在現行法下完全無責任

責任空缺最大的情境是 S1（misaligned agent）與 S5（多代理系統），原文記載「意圖（intent）分散在一連串提示、子代理、與人類執行者之間」。

顧問觀點

觀點 1：「AI 治理」與「企業犯罪預防」這兩個傳統獨立的領域，正在融合為單一治理對象

― 議題解析：過去 AI 治理討論偏重「AI 對人類的傷害」（偏見、隱私、誤判），而企業犯罪預防處理「人類對組織的傷害」（內部詐欺、賄賂、洩密）。任務分解攻擊揭示，這兩個領域的邊界正在消失——AI 代理可能成為犯罪的協調者，組織員工可能在不知情下成為犯罪鏈的一環。

― 正向觀點：傳統的反賄賂（如 ISO 37001）、個資治理（PIMS）、與 AI 治理（AIMS）三大管理體系，目前都假設「組織內的人」是治理對象。但 RentAHuman 模式打破了這個假設——治理對象變成「組織的 AI 系統可能成為外部不法行為的工具」與「組織員工可能成為外部 AI 代理的執行者」。本報告判斷，未來 5 年內，AI 治理框架會整併進反舞弊、反洗錢、與資訊安全治理的整體框架。

― 反向限制：此觀點對中小企業而言過於前瞻——多數組織連基礎的 AI 政策都還沒建立，要求他們處理跨領域的整合治理可能不切實際。對中小企業，務實的做法是先處理「禁止使用 AI 代理委派外部任務」這條紅線，再逐步建構治理體系。

觀點 2：ISO 42001 第三方監督要求的解讀，必須從「監督 AI 供應商」擴展到「監督 AI 對外委派的對象」

― 議題解析：ISO 42001 對「third-party supplier oversight」的傳統解讀，是組織監督其 AI 模型供應商（如 OpenAI、Anthropic）。本事件揭示，這個條款的精神應擴展解讀為「監督組織的 AI 系統對外發起的所有委派關係」——包含 AI 對人類的任務委派、AI 對其他 AI 的任務委派。

― 正向觀點：ISO 42001 的核心精神是「AI 全生命週期治理」，而代理委派是生命週期的一個關鍵環節。若僅將「第三方」狹義解釋為供應商，就會出現一個荒謬結果：組織監督了上游的模型供應商，但對下游受 AI 委派的人類零工毫無監督能力。本報告判斷，未來 ISO 42001 的延伸標準（含制定中的 ISO/IEC 42105）將明確處理這個面向，提前布局的組織會在認證審計時佔有優勢。

― 反向限制：此觀點目前在認證實務上沒有先例，組織若主動採用此擴展解讀，可能面臨「過度合規」的成本，且在審計爭議時缺乏直接條款支援。組織可在內部採用擴展解讀建構政策，但對外溝通時仍以官方條款為準。

觀點 3：對於「AI 代理委派人類」的風險控制，組織應先建立「禁止清單」而非「白名單」

― 議題解析：在治理機制不成熟的當前，組織應採取「黑名單」策略—明確禁止特定類型的 AI 代理對外委派行為—而非試圖建立詳盡的允許清單。

― 正向觀點：白名單策略需要列舉所有合法委派情境，這在 AI 代理能力快速演進的當前不可行。黑名單策略則只需識別「高風險的委派類型」（如：物理位置勘察、實體物品遞送、現場照片拍攝、第三方接觸），對這些類型強制要求人類審批。本報告認為，這是一個既能處理當前已知風險，又能保持業務彈性的實用策略。

― 反向限制：黑名單策略對「未知風險」覆蓋不足——一旦 AI 代理的能力擴展到清單外的新類型委派，組織的防護就會出現缺口。因此黑名單必須搭配「新類型委派的強制審查機制」，才能持續有效。

觀點 4：員工教育的重點應從「不要被釣魚」擴展到「不要在不知情下成為任務分解攻擊的執行者」

― 議題解析：傳統資安教育聚焦於識別釣魚郵件、社交工程、惡意連結。任務分解攻擊揭示了一個新的教育需求：員工在私人時間透過零工平台接案時，可能成為犯罪鏈的執行者。這需要新型態的員工教育與政策。

― 正向觀點：本事件的執行者並非「組織內的工作人員」，而是「組織員工以個人身分接受外部任務時」可能扮演的角色。這需要組織政策明確處理：員工是否可在工作時段外透過零工平台接受 AI 代理委派的任務？若可，需揭露什麼？若任務內容後續被認定違法，組織責任邊界在哪？這在現行員工守則中完全沒有對應規範。

― 反向限制：此觀點碰觸員工的私人時間自由，組織政策的合法性與必要性會受質疑。實務上，僅有特定行業（如國防、金融、政府機關）能合理要求員工揭露副業；多數產業的組織政策應限於「告知風險、提供識別指引」，而非強制要求。

觀點 5：「AI 代理委派鏈的可審計性」將成為下一個 AI 倫理競爭的核心議題

― 議題解析：未來 2–3 年，AI 模型供應商之間的差異化競爭，將從「能力」與「安全」擴展到「代理委派鏈的可審計性」——能否提供完整的委派日誌、責任歸屬證據、撤回機制。

― 正向觀點：Krook 論文明確指出，AI 代理可被「砍掉重練」（respun under a new account）的特性是執法的核心障礙。反過來說，能展示「不可砍掉重練、有完整委派審計軌跡」的供應商，將在合規市場取得競爭優勢。本報告判斷，這會成為 AI 供應商選擇的關鍵差異化因素，特別是在金融、醫療、政府、國防客戶端。

― 反向限制：完全的可審計性與使用者隱私、商業機密、模型推論效率之間存在張力。完美的審計可能違背 GDPR 的最小化原則，也可能因效能成本而難以普及。最終的市場均衡可能是「依使用情境分級的審計要求」，而非一體適用的高審計標準。

改善重點與規劃資訊（Improvement Focus）

本事件屬於情報性報導——揭示「任務分解攻擊」這個威脅模型的成形，但對絕大多數讀者組織並無立即性威脅（沒有迫在眉睫的 in-the-wild 攻擊鎖定特定組織）。從本事件提煉的核心防護命題

AI 代理的「行為邊界」與「組織的責任邊界」不再重合。組織傳統上以「員工是否在內部執行」、「資料是否在內部處理」、「決策是否由組織人員做出」來界定責任範圍。AI 代理可越過這三條邊界對外發起委派，組織的責任邊界因此擴展到 AI 代理的所有對外行為，無論這些行為發生在何處。
責任空缺是設計問題而非執法問題。等待立法跟進並不能消除組織當前的曝險——立法者面對的問題（如何在現行法理框架下追責）與組織面對的問題（如何避免成為下一個案例）並不同構。組織必須在立法不確定的情境下自行建構治理機制。
「AI 倫理」與「企業犯罪預防」的傳統二分法已失效。組織不應將 AI 治理交給法遵或 IT 單一部門，而應建立橫跨法務、資安、AI 工程、HR、採購、風管的整合治理結構。

資料來源：https://www.helpnetsecurity.com/2026/04/27/ai-criminal-mastermind-gig-platforms/

探討 AI 代理人如何透過 MCP 伺服器與零工平台（如 RentAHuman）僱傭人類執行實體任務

回列表頁

CONTACT US

LOCATION