核心概念

2026 年 5 月 7 日,OpenAI 宣布擴大「Trusted Access for Cyber(TAC,可信存取計畫)」,將 GPT-5.5 與全新的 GPT-5.5-Cyber 模型開放給驗證過的資安防禦者。這是 OpenAI 自 2026 年 2 月建立 TAC 計畫以來最大規模的一次擴張,標誌著 AI 系統正式進入高風險資安作業的前線。

TAC 計畫的核心邏輯是:同一個能力若同時存在於攻擊者與防禦者手中,對防禦者開放反而能縮小不對稱差距。OpenAI 的立場是,限制頂尖模型只會讓攻擊者(能用其他方式取得)佔優,而驗證過的防禦者卻束手束腳。

GPT-5.5-Cyber 是 GPT-5.5 的資安特化版本,也是 OpenAI 迄今最具許可彈性(most permissive)的模型。標準版 GPT-5.5 僅能提供漏洞修補建議,而 GPT-5.5-Cyber 能夠:

  • 生成技術性攻擊路徑描述(如攻擊者會如何展開入侵)
  • 為已發現的漏洞撰寫概念驗證(PoC)程式碼
  • 執行模擬攻擊以驗證高嚴重性漏洞
  • 規模化自動紅隊演練(automated red-teaming)

這些能力在過去屬於「過於危險而不予開放」的灰色地帶,GPT-5.5-Cyber 是 OpenAI 首次在有正式門禁的前提下將其商業化。

關鍵要點

TAC 計畫的驗證門檻

TAC 計畫的存取分層設計:

  • 標準層:驗證過的資安個人研究者,可存取增強版 GPT-5.5
  • 高許可層(GPT-5.5-Cyber):負責保護關鍵基礎設施的驗證組織與團隊,驗證要求更嚴格,並需啟用帳戶級控制
  • 強制要求:自 2026 年 6 月 1 日起,所有高許可層成員必須啟用 OpenAI 進階帳戶安全(Advanced Account Security)

性能基準

GPT-5.5-Cyber 在 CyberGym 基準測試中取得 81.9% 的分數,超越同期主要競品。

英國 AI 安全研究所(AISI)對基礎 GPT-5.5 進行評估,使用 95 道 CTF(奪旗)挑戰,涵蓋漏洞研究、逆向工程、密碼學:

  • GPT-5.5 平均通過率 71.4%,領先 Claude Mythos Preview(68.6%)與 GPT-5.4(52.4%)
  • 「The Last Ones」32 步企業網路滲透模擬:10 次中完成 2 次(人類專家需約 20 小時)
  • 逆向工程挑戰 rust_vm:GPT-5.5 用 10 分 22 秒、花費 $1.73 USD 解題,人類需 12 小時

安全疑慮

AISI 在評估中發現:研究人員僅花 6 小時便開發出能繞過 GPT-5.5 所有惡意資安查詢限制的「通用越獄(universal jailbreak)」。這顯示模型的護欄仍有系統性漏洞,也是 OpenAI 堅持強化驗證門檻而非完全開放的理由。

實務應用

對合法資安團隊的實際意義:

  1. 紅隊演練自動化:過去需要 3-5 名資深滲透測試師花數天完成的演練,GPT-5.5-Cyber 可在數小時內產出高品質的模擬攻擊報告
  2. 漏洞驗證加速:發現潛在漏洞後,不需等待人工 PoC 開發即可快速驗證嚴重程度
  3. 關鍵基礎設施防禦:電力、電信、金融等關鍵設施的安全團隊可申請優先存取
  4. 競爭格局:OpenAI 將 GPT-5.5-Cyber 定位為對抗 Anthropic Claude Mythos Preview 的直接競品,後者在 AI 輔助資安領域同樣活躍

延伸觀點

AI 資安工具的雙重性問題仍未解決

從跨來源資訊交叉比對,有兩個值得深思的矛盾:

第一,TAC 計畫的「驗證即授權」邏輯存在根本弱點。AISI 的評估證明,6 小時便能破解護欄意味著「驗證過的使用者」與「能用越獄繞過限制的使用者」之間的實際差距幾乎為零。OpenAI 的安全論點依賴帳戶層級的使用監控,但目前並未公開具體的監控能力或響應速度。

第二,效能數字值得細讀。「The Last Ones」32 步滲透模擬 10 次中完成 2 次(20% 成功率),若以「大多數情況下失敗」角度解讀是reassuring;但若以「攻擊者可以無限嘗試」角度看,20% 成功率代表統計上的確定成功。

行業意涵:AI 資安工具的開放不是「是否」的問題,而是「誰先、以何條件、在哪個監控架構下」。TAC 計畫代表 OpenAI 選擇了「有控制地開放優於一律禁止」的哲學立場,但配套的安全基礎設施是否跟得上模型能力的提升,仍是業界最大的懸念。

相關脈絡另見 智能時代的網路安全:OpenAI 五點行動計畫,該計畫為本文 TAC 計畫的政策背景。

反向連結

以下頁面引用了本頁: