核心概念

AI 模型需要持續從真實世界的對話中學習,才能提升品質——但這與用戶隱私之間存在根本張力:你的對話越被善用,模型就越有幫助;但越被使用,隱私風險也越高。OpenAI 在 2026 年 5 月發布的這篇文章,系統性說明 ChatGPT 如何在這兩個目標之間取得平衡。

訓練資料來源

ChatGPT 的訓練數據來自三個管道:

  1. 公開可取得的資訊:網路上的公開文本、書籍、論文等
  2. 合作夥伴授權資料:透過商業合約取得的資料集
  3. 用戶對話:在用戶啟用「協助改善模型」設定後,對話內容可能被納入訓練

第三個管道最敏感,也是本文的重點。

OpenAI Privacy Filter

OpenAI 在訓練流程中部署了「OpenAI Privacy Filter」,聲稱是「同類工具中最有效移除個人資訊的工具」。這個過濾器在多個訓練階段運作:

  • 公開資料集清理階段:在訓練前過濾爬取的網路資料
  • 用戶對話使用階段:當對話被納入訓練時,先經過 PII 過濾

技術上,這類過濾器通常結合命名實體識別(NER)自動標記並移除政府身份證號、銀行帳戶、地址、醫療紀錄等敏感資訊。但研究顯示,單純的 PII 過濾無法保證完整移除——AI 仍可能從非 PII 資料推斷出個人身份(例如從特定措辭風格或地理細節)。

關鍵要點

用戶隱私控制選項

OpenAI 提供四層控制機制,從最寬鬆到最嚴格:

選項 對話歷史 訓練貢獻 資料保留期限
預設(啟用訓練) 保留 長期
關閉「協助改善模型」 保留 長期
Temporary Chat(暫時對話) 不保留 30 天(安全用途)
Zero Data Retention(企業方案) 不保留 零天

關鍵細節:即使關閉模型訓練,對話仍可能被保留 30 天用於安全濫用監控。只有企業 ZDR 方案才能完全消除這段保留期。

Memory 功能的隱私設計

Memory(記憶功能)是 ChatGPT 的選擇性個人化工具,讓模型記住用戶偏好以改善後續對話。設計上採用明確的用戶控制:

  • 用戶可隨時查看已儲存的記憶內容
  • 可單筆刪除或一次清除所有記憶
  • 記憶內容不會在不同用戶間共享

這與傳統訓練數據的「匿名混合後無法追蹤」不同——Memory 是明確可見、可控的個人資料。

回應隱私與錯誤處理

ChatGPT 系統性拒絕直接提供個人敏感資訊的請求(如特定人的地址、社會安全號碼等),但系統仍可能發生兩類錯誤:

  1. 不準確資訊:生成關於真實人物的錯誤描述
  2. 過度揭露:非預期地整合碎片化資訊推斷出個人細節

OpenAI 提供隱私申請入口,個人可提交「資訊不準確」或「移除請求」,由人工審核處理。

商業帳戶的不同預設值

ChatGPT Business、Enterprise 和 API 平台的隱私預設值與個人帳戶相反:預設不使用輸入輸出資料訓練模型。這反映了企業用戶對資料機密性有更高的合規要求,也是 B2B AI 產品的普遍做法。

實務應用

對個人用戶:若想保留對話歷史但不貢獻訓練資料,進入 設定 → 資料控制 → 協助改善模型(關閉) 即可,這是大多數隱私意識用戶的推薦設定。

對企業採購者:評估 ChatGPT 企業方案時,確認是否需要 Zero Data Retention(ZDR)。一般 Business 方案預設不訓練,但對話仍有短期保留期;ZDR 是最強的隱私保證。

對開發者:透過 API 呼叫 OpenAI 模型,預設不會用於訓練——但若主動加入訓練計畫,需要確認自己的上游資料來源是否已取得必要同意。

延伸觀點

針對本文的隱私框架,學術界和業界有更深入的討論:

差分隱私(Differential Privacy)的真實限制:OpenAI 提及的 Privacy Filter 屬於 PII 過濾,但 2025-2026 年研究顯示,即使搭配差分隱私(在訓練中加入數學噪聲),針對性的「成員推斷攻擊(Membership Inference Attack)」仍能以統計方式判斷特定資料是否被用於訓練。研究者引入「金絲雀資料(Canary Data)」方法,可作為量化隱私保障強度的實用工具。這說明 OpenAI 的 Privacy Filter 聲稱「最有效」,但「有效」仍有程度之分,並非完全無法突破。

「協助改善模型」的預設值政治學:多個分析指出,主流 AI 廠商對訓練資料的預設設定存在明顯差異——多數消費者方案預設允許訓練,而企業方案預設禁止,這反映的不只是技術選擇,更是商業利益與法規壓力的平衡。GDPR 要求明確同意(Opt-in),而美國隱私法規較為寬鬆,允許預設 Opt-out 設計。

與 Anthropic/Claude 的設計差異:Claude 的隱私設計在公開文件(System Card)層面強調不同的透明度路徑——Claude Mythos 系統卡分析 中可看到 Anthropic 更偏向透過模型文件說明訓練邊界,而非依賴用戶手動設定開關。兩者代表了「結構性設計」vs「控制權下放」的不同哲學取向。

→ 相關頁面:OpenAI 社群安全承諾:ChatGPT 的多層防護與執法通報機制OpenAI 進階帳戶安全(Advanced Account Security)Claude Mythos 系統卡分析AI 模型文件標準:Model Card 與 System Card

反向連結

以下頁面引用了本頁: