核心概念
OpenAI Codex 自 app 上線三個月,出現了一個反直覺的數字:超過 50% 的任務是非技術類的。這個來自 Codex 與 ChatGPT 主管 Tibo 的觀察,標誌著 AI Agent 工具正在完成一次靜悄悄的跨界——從工程師的 CLI 工具,進化為一般知識工作者的日常助理。
Agent 技術成熟的三個指標
Tibo 認為改變的不是使用者,而是技術本身成熟了。三個關鍵指標:1)任務穩定性:Agent 能在長時間任務中保持穩定,中途出問題不再需要技術背景介入。2)工具廣度:超過 100 個 plugin,加上 computer use 和 browser use,讓 Agent 可以操作真實 UI 環境,而非僅依賴 API。3)模型可靠度:GPT-5.5 的基礎可靠度使非精準 prompt 也能產生有用結果。
知識工作的自動化典範
Tibo 的框架是:去看每天花時間在什麼地方。市場研究、email 整理、客戶篩選——這些過去只有技術人員能自動化的工作,現在可以在 app 內用自然語言說出來。更關鍵的是,「每 12 小時執行一次,完成後寄 PDF 給我」這種 cron schedule 概念,第一次對非技術使用者變得可及。他自己的用法非常雜:coding、策略規劃、當天筆記(直接在 Codex 裡記,自動建立 memory)、追蹤沒回覆的重要 email 和 Slack 訊息。
Auto Review:讓 Agent 自我監督
Codex 最新的 auto review 機制設計了雙 Agent 架構:主 Agent 執行任務,第二個 Agent 同步驗證主 Agent 的每個動作,確認沒有風險行為。這個機制來自 OpenAI 的 safety team 與 alignment 研究,目標是讓 Agent 能更長時間自主運作。比方說,agent 不會把你的個人資訊寄給陌生人。參見 AI Agent 生產環境防線:最小權限與稽核控制。
資料的準備原則
Tibo 對「如何準備資料給 Agent」有具體建議:不要用文字解釋你的語氣風格,直接放過去寫的 newsletter、錄音片段、訊息記錄作為樣本。他預告三個月內資料將從本地遷移至雲端,不同裝置的 Agent 會共享同一個 memory 和檔案系統。
人類的不可替代責任
Tibo 的核心立場是 augment(擴充),不是 replace。用 Agent 產出的程式碼,責任歸使用者。Code review 不能外包「理解」——人類必須理解整個系統怎麼運作。他也提醒一個陷阱:過早把所有事都交給 AI,反而造成大腦超載;這代表你在拓展邊界,知道什麼現在能做、什麼還需要等待。相關討論見 AI Agent 工作流的人機分工原則。
Vibe Coding 的邊界
非技術人員做小規模產品完全可行,但 Tibo 認為 6-9 個月內 Agent 才會在長期維護性和架構正確性上有顯著改善,目前要做規模化商業產品仍需技術人員。見 Vibe Coding 與工程師角色重構。
Ambient Intelligence:非 prompting 的未來
Tibo 用「ambient intelligence」描述願景:未來受益於 AI 不應取決於 prompting 能力。他用裁縫比喻:好裁縫一眼看著你就知道什麼衣服適合你。關鍵是 engaging as your authentic self——在自然對話中做你自己,在對的時間得到對的幫助。
關鍵要點
- Codex app 上線三個月,非技術任務超 50%,代表 Agent 已跨越技術族群邊界
- Auto review 雙 Agent 架構:執行 Agent + 驗證 Agent,讓長時間自主運作成為可能
- 資料準備原則:放實際樣本(newsletter、訊息記錄),不要用文字說明語氣風格
- Vibe coding 個人玩具 OK;規模化商業需技術人員,6-9 個月後架構維護性才會改善
- 人類責任不可外包:「理解整個系統」是 Agent 無法取代的核心能力
- Ambient Intelligence 願景:受益於 AI 不應依賴 prompting 能力,而是自然互動
實務應用
Chief of Staff 模式:連接 Gmail + Calendar + Docs,用自然語言說「當我的 chief of staff,整理今天的 breakdown,告訴我什麼重要」。訪談中 Tibo 示範的 live demo 展示了 Codex 同時跑多個 agentic thread:掃 email 找今日相關討論串、查行事曆空檔規劃旅行、整理過去兩週的產品更新。
早晨報紙:設定 Agent 每天整理 Slack 上的新聞,自動印到實體印表機。Tibo 認為這類 daily briefing 模式很快會成主流。
Skill 固化:Codex 的 skill creator 功能可以把喜歡的 workflow 固化成可重複執行的技能,之後每天自動跑,不需每次重新 prompt。
Computer use 示範:訪談中 Tibo 讓 Codex 直接操作瀏覽器進入 LinkedIn,自己點擊導航、下載資料、建立試算表,整個過程五到十分鐘,使用者用語音追加需求,Agent 繼續執行。
延伸觀點
三個獨立來源的交叉驗證,強化了訪談中的三個核心主張:
人類問責不可消除:哈佛商學院研究確認,Agentic AI 的最佳實踐是 Plan(人設定)→ Execute(Agent 執行)→ Learn(人審查)的三階段循環。人類保持對「策略決策」和「道德守門」的主導,這與 Tibo 的「人類仍需負責」完全一致。不只是外交辭令,而是系統設計的硬性需求。
知識工作自動化的主力場景:MindStudio 的 2026 年報告顯示,ROI 最高的場景都是觸發式或排程式任務——競爭情報監控、每週市場研究報告、財務數據自動填報。這正是 Tibo 描述的模式:不是把 AI 當聊天工具,而是設計成「有條件自動運行的工作流」。文件處理類任務縮短 60-80% 時間,研究合成從數小時壓縮到 45 分鐘。
Vibe coding 邊界有數據支撐:arXiv 2512.11922 研究確認,AI 輔助編碼在 MVP 和快速原型上表現優異,但在生產環境中因缺乏明確設計理由,技術債以不可持續的速度累積。Tibo 預測 6-9 個月才能改善,與學術界的技術債時間線吻合。
相關頁面:AI Agent 設計模式 · 2026 年 Agentic AI 七大趨勢 · Agentic AI 企業落地現實:基礎建設障礙與突破策略 · Simplex × Codex:AI 原生軟體開發的五個轉型原則 · AI 就業效應與 Jevons Paradox
反向連結
以下頁面引用了本頁:
- 2026 年 Agentic AI 七大趨勢(技術與AI)
- AI Agent 工作流的人機分工原則(技術與AI)
- AI Agent 生產環境防線:最小權限與稽核控制(技術與AI)
- AI Agent 設計模式(技術與AI)
- AI 就業效應與 Jevons Paradox(技術與AI)
- Agentic AI 企業落地現實:基礎建設障礙與突破策略(技術與AI)
- Simplex × Codex:AI 原生軟體開發的五個轉型原則(文章精選)
- Vibe Coding 與工程師角色重構(產業觀察)