OpenAI 最新威脅情報報告揭露多起來自中國的濫用 ChatGPT 行動,其中包括對台灣以抵抗入侵為題材的遊戲《逆統戰》進行組織輿論攻擊、對歐美政治圈的社交工程滲透,以及中國駭客利用 AI 技術發展資安攻擊工具與進行社群操作。凸顯生成式 AI 已成為新時代資訊戰的關鍵工具。
人工智慧開發公司 OpenAI 6 月 5 日發布最新威脅情報報告,揭露多起來自中國的濫用 ChatGPT 行動,其中包括對台灣以抵抗入侵為題材的遊戲《逆統戰》進行組織輿論攻擊、對歐美政治圈的社交工程滲透,以及中國駭客利用 AI 技術發展資安攻擊工具與進行社群操作。
生成式AI:跨境資訊操控與網路間諜的新工具
報告中列出十起案例,本文將聚焦其中四起明確與中國有關的案例。這項揭露,顯示生成式 AI 已成為跨境資訊操控與網路間諜的新工具。
現正最夯:反罷免「黨外在野大聯盟」成員曝光!王興煥:這是一群內奸自白名單
報告指出,這些案例皆為 OpenAI 在過去三個月內新偵測並成功阻斷的行動, 透露出濫用者相較以往更具組織性與技術細節,並反映出濫用行為具即時性與持續進化的風險。
攻擊台灣戰略遊戲《逆統戰》 系統性輿論操作現形
OpenAI 將這起行動命名為「Sneer Review」(冷嘲熱諷評論),指出涉案帳號透過 ChatGPT 大量生成中文與英文的社群貼文與長文內容,針對台灣獨立遊戲《逆統戰》發動集中式輿論攻擊。
這款遊戲以抵抗中國統治為題材,攻擊內容多指其「不尊重歷史」、「煽動仇中情緒」,並試圖捏造該遊戲在中文社群平台上遭遇「群起抵制」的假象。
由台灣團隊境外戰略溝通小組(ESC)開發,最初為 2020 年透過群眾募資推出的桌上戰略遊戲,以虛構亞洲地圖展開反抗中國統治的設定,玩家可扮演圖博、台灣、香港等勢力對抗紅軍。由於明確反共題材,當時即遭中國媒體點名批判為「台獨宣傳工具」。
2025 年,《逆統戰:烽火》推出手遊版本,延續同一世界觀,不僅遭遇來自中國的 DDoS 攻擊,也被列入禁播名單,甚至未正式上線前便遭封殺。Google Play 也以「未禁止玩家以仇恨言論進行命名為理由」為由將其下架,僅能透過官網取得。
對準批評中國的社運人士 進行性羞辱
同一行動(Sneer Review)也將矛頭對準 Mahrang Baloch——一位長期批評中國在俾路支斯坦(Balochistan)投資行為的巴基斯坦社運人士。涉案帳號以 ChatGPT 協助撰寫內容,在 TikTok 和 Facebook 散播她曾參與色情影片的不實謠言。
Baloch 長年揭露中國「一帶一路」計畫在當地造成的土地剝奪與軍事化問題,並質疑中巴經濟走廊(CPEC)對俾路支人的社會影響,因此成為政治宣傳與人格抹黑的目標。
OpenAI 偵測到,TikTok 上兩支針對 Baloch 的影片獲得 25,000 個讚,搭配逾 200 則 AI 生成留言;而 X(前 Twitter)主帳號的貼文則平均獲得 約 10,000 次瀏覽。儘管總體規模仍屬初期,這些數據顯示其操作已有一定滲透力。

此外,該行動網絡還曾使用 ChatGPT 生成一份風格近似中國公安體系的內部評估文件,內容詳列帳號登入時間、發文目標與操作策略。OpenAI 認為,這顯示行動者不僅以 AI 工具執行輿論操作,更在進行制度化管理。
Sneer Review 行動依據「資訊操控行動影響力分級指標」(IO impact Breakout Scale,後述)被 OpenAI 評為第 3 級偏低,前提是互動數據是真實的,但若證實大部分互動為虛假,評級可能下調。
假記者與智庫收集情報 誘導西方政策圈洩密
被命名為「VAGue Focus」(模糊焦點)的行動則專注於社交工程與假身分滲透。OpenAI 發現一小群以中文為主的帳號,使用 ChatGPT 生成英文社群貼文、假記者簡歷與虛構智庫介紹,並翻譯大量與美國、歐洲決策圈互動的訊息。
這些訊息以 Focus Lens News、BrightWave Media Europe 與 Visionary Advisory Group(VAG)等名稱對外自稱為媒體與智庫。
這些帳號曾生成邀約信,開出高達每小時 2,000 美元的專訪費,企圖誘使美國專家提供政策意見。OpenAI 發現其中一個 X 帳號為 Focus Lens News,擁有 17,000 名追蹤者,但該帳號可能為回收自 2014 年的舊帳號並改名用途。

報告指出,與去年相比,此類操作顯示出更高的適應能力,例如 VAGue Focus 行動學會將不同工作流程分離(如內容生成、訊息翻譯、社群帳號建構等分由不同帳號執行)。
這麼做可以規避單點失敗或同一帳號暴露多重用途,這代表行動者正逐步提高隱蔽性與對抗性。此行動被評為第 2 級偏低。
國家級駭客利用 AI 攻防 從開發工具到社群滲透全包辦
OpenAI 並指出,中國兩個已知的國家級駭客組織 APT15(VIXEN PANDA)與 APT5(KEYHOLE PANDA),曾使用 ChatGPT 協助執行滲透前期準備與社群自動化工具開發。
這些帳號請求協助撰寫腳本暴力破解 FTP 密碼及掃描伺服器的特定端口、使用 Nmap 輸出進行 AI 分析,並打造模擬 Android 裝置滑動點擊的腳本,在Twitter、Facebook、Instagram 和 TikTok 等社交媒體上發布內容或為內容按讚。
他們也曾查詢 SIPRNet(美國國防部機密網)等政府科技與供應鏈資料,並使用模型生成分析報告與基礎開發腳本。
雖然這些攻擊能力仍屬常見範圍,OpenAI 強調,雖然這些駭客利用 AI 工具提高了開發效率,讓攻擊更具彈性,但並未獲得前所未有的新能力,主要是加速了既有的攻擊手法。
冒充退伍軍人操作關稅輿論 雙向操作分化美國社會
被稱作「Uncle Spam」(垃圾郵件叔叔)的行動由中國來源帳號操作,使用 ChatGPT 同時生成支持與反對美國關稅政策的極端言論,投放至 X 和 Bluesky 平台。帳號多冒充退伍軍人,搭配 AI 生成的大頭貼與徽章,試圖建立「退伍軍人社群」的假象。

這些貼文在平台上大多僅獲個位數或零互動,OpenAI 因此將其評為第 2 級(多平台活動但無突破或僅有最小互動)。
報告也指出,此行動繼承自 2022 年由 Meta 首度揭露的行動網絡,當時他們通常在與中國工作日一致的時間發布社交媒體內容,與美國時區相差十二小時,但現已進一步演化成使用 LLM(大型語言模型)工具調整發文時段、分析受眾特徵。
資訊操控行動影響力分級指標
OpenAI 在報告中採用了由美國智庫布魯金斯學會(Brookings Institution)提出的「IO impact Breakout Scale」(資訊操控行動影響力分級指標),用以評估各類網路影響行動的實際觸及與擴散程度。
這套指標以內容是否跨越單一平台及特定社群作為評估標準。共分為 6 級,最低的第 1 級僅在單一平台的單一社群內傳播;第 2 級為單一社群跨多平台,或單一平台跨多社群;第 3 級則指跨多平台多社群;第 4 級完全突破社交媒體範疇,獲主流媒體放大;第 5 級獲名人或政治人物等高知名度個人放大;最高的第 6 級引發政策回應或包含暴力呼籲。
依據該評估標準,OpenAI 將中國相關行動大多歸類為第 2 至第 3 級,意指這些行動雖具備組織性和一定的技術水準,但實際觸及真實用戶的程度有限,多數內容缺乏有機的互動和擴散,仍屬低度滲透階段。
前次追蹤報告:中國行動已持續超過半年,出現適應與進化跡象
根據 OpenAI 今年 2 月的先前報告,中國的影響行動網絡已在當時被追蹤,包括與知名資訊操作網絡「Spamouflage」相關的帳號群組,當時便透過 ChatGPT 生成多語言內容,針對台灣、美國等地區進行輿論干預,活動多為短篇評論、低品質的帳號操作,主要集中在 YouTube、Facebook 和 X 等平台。
相較之下,2025 年 6 月報告揭示的行動不僅涵蓋更多語言與平台,還出現如「VAGue Focus」行動這類流程分離、分工細化的組織運作模式——例如將內容生成、翻譯、發布等任務分由不同帳號執行,展現出對抗模型偵測與平台政策的明顯進化。
這代表中國參與的資訊行動正從粗放式大量發布,逐步轉向更精細、隱蔽性更強的滲透手法。
OpenAI 特別指出,這類惡意行動者具備「回饋學習」能力,能從失敗案例中改進策略,並採取跨語言切換、帳號輪替、主題偽裝等規避偵測手段。報告強調,未來偵測與對抗這些行動,將需仰賴 AI 模型與人力分析的結合,才能維持準確辨識能力。
偵測與下架:OpenAI 處理濫用帳號的方法
OpenAI 表示,所有模型部署均遵循去識別化與隱私優先原則,偵測過程不涉及用戶個資或逐筆監控。其威脅識別與應對流程主要包含三大機制:
- 異常使用模式分析:例如帳號集中於特定時段大量輸入異常指令、頻繁切換語言、輸出風格一致等,皆為潛在濫用指標。
- 生成內容樣式比對:觀察模型輸出的語言特徵是否在多個社群平台出現高度重複、由相似帳號群集中散佈,有助辨識組織化行動。
- 外部威脅通報整合:OpenAI 與 Meta、Google、Anthropic 等平台建立線索共享與交叉驗證機制,協力追蹤並阻斷濫用行為。
在確認違規後,OpenAI 將根據使用政策對相關帳號進行封鎖、限制模型存取權限,或中止 API 使用。OpenAI 強調,雖然目前尚無證據顯示生成式 AI 已帶來前所未見的操控能力,但威脅行為者正快速學習如何藉由生成內容擴大資訊操弄與間諜活動,未來的防禦需仰賴跨平台合作與產業聯防。
作者:陳怡菱,報呱副主編。
參考資料連結:
2025/06/05 OpenAI Disrupting malicious uses of AI: June 2025
2025/02/21 OpenAI Disrupting malicious uses of AI