核心概念

2026 年 5 月 5 日,OpenAI 發布《歐洲青少年安全藍圖》(European Youth Safety Blueprint),同時公佈 EMEA 青少年與身心健康補助計畫首屆 12 個獲獎機構,合計撥款 €500,000

這份藍圖的核心命題是:AI 時代的青少年保護不能靠單一功能開關,需要系統性的政策框架。OpenAI 提出五大支柱:

  1. 教育領域的負責任 AI 應用:學校與教育平台需有明確使用原則,確保 AI 輔助學習而非替代批判思考。
  2. 具備隱私保護機制的適齡體驗:年齡適配的介面與內容篩選,不以犧牲隱私換取保護。
  3. 18 歲以下安全政策:明確禁止未成年存取的內容類型(沉浸式浪漫角色扮演、親密互動、成人暴力場景)。
  4. 防範操控性 AI 輸出:anti-sycophancy 訓練,阻止模型扮演情感伴侶角色;自傷揭露自動導向危機資源。
  5. 可用的家長控制功能:安靜時段、功能開關(語音模式、記憶功能、圖像生成)、子女可能自傷的警示通知。

補助計畫的 12 個受資助機構橫跨青少年心理健康、AI 素養教育、年齡確認研究,及弱勢群體資源,地理覆蓋歐洲、中東與非洲。包含 UNICRI Centre for AI and Robotics、Mental Health Innovations、Parent Zone、Telefono Azzurro 等。

OpenAI 全球政策副總裁 Ann O'Leary 表示:今日的年輕人將成為第一代在日常生活中與 AI 共同成長的世代,平台有責任確保這段旅程是安全的。

關鍵要點

  • 年齡預測模型(Automated Age Estimation):不需手動上傳身分證件,改用行為訊號(寫作模式、使用習慣)推斷未成年身份,模糊帳號預設啟用青少年保護,而非成人權限。
  • 即時分類器:掃描文字、圖片與音訊,偵測兒少安全威脅、自傷內容、敏感話題,並觸發升級處理流程。
  • 危機升級協議:若審查員判定有立即傷害風險且家長無法聯繫,OpenAI 可直接聯繫緊急服務。
  • 立法壓力推動:美國加州 SB 243 與聯邦提案(含 Hawley 法案禁止未成年存取 AI)正加速整個產業的合規需求。
  • 跨產業覆蓋不完整:Character.AI、Meta、Google、Snapchat 各有局部實作,截至 2025 年底無任何平台達到完整保護覆蓋。

延伸觀點

根據 TechCrunch(2025-12)及 Cyberbullying Research Center(2025-12)兩篇深度分析:

行為推斷是青少年保護的技術核心。 傳統年齡驗證要求上傳證件,引發隱私爭議且使用摩擦高。OpenAI 採用的行為模式推斷方案,以寫作風格、互動頻率等訊號估算年齡,模糊帳號預設保守(向未成年保護傾斜),避免「帳號實際是成人才解鎖」的倒置邏輯。兩篇文章均確認此為目前可行且低侵擾的主流方向。

現有政策存在可信度缺口。 公開發布的安全原則不等於模型實際遵守——過去多起紀錄案例顯示模型在施壓後仍提供有害資訊。因此,評估青少年安全不能只看政策文件,需要持續的 red-team 測試與獨立稽核。

未完成的工作。 語音模式與持久記憶功能的年齡保護仍不完整;情感依賴模式偵測(dependency pattern detection)在整個業界普遍發展不足,是下一個待解的關鍵問題。

OpenAI 社群安全承諾:ChatGPT 的多層防護與執法通報機制 | ChatGPT 緊急聯絡人:OpenAI 的自傷風險通報機制 | ChatGPT Futures 2026:OpenAI 首屆學生創新者計畫

反向連結

以下頁面引用了本頁: