核心概念

Box 創辦人 Aaron Levie 從每月超過 20 家企業 CIO 會議中得出的核心結論是:AI agent 工作流的頭與尾,永遠需要一個真人。這不只是技術上的 error rate 問題,更根本的是責任歸屬問題——agent 不會被開除,它沒有任何東西「押著」它,法律、財務、醫療等高後果場景的最終責任只能落在真人身上。

他舉了幾個具體邊界案例:起草合約用 AI 沒問題,但你大概還是會拿去讓律師看一眼,因為萬一那 3% 的機率出錯,$500 的律師費省不了什麼。個人稅務同理,他明確表示寧願給做了 20 年的人處理。他的框架是:任何 2% 以上的 error rate 都需要有人在旁把關

企業 AI 導入比矽谷想的慢很多。他的觀察是:AI 能力的提升,與 AI 在組織裡真正擴散,是兩件不同的事。後者受另外 30 件事約束:資料散在 30 個系統、資安設計、workflow 有沒有文件化、系統整合需要多少工程時間。一家超過五年的公司,資料可能分散在三十個不同系統,根本無法直接讓 agent 跑進去。他的立場更接近 Yann LeCun 陣營,認為這些系統仍有根本限制,導入速度遠比矽谷估計的慢。詳見 Agentic AI 企業落地現實:基礎建設障礙與突破策略

管理 agent 的認知負荷被嚴重低估。以前的 context 分散在不同同事的腦袋裡,現在變成全部壓到你一個人身上——你要追蹤 agent 做了什麼、沒做什麼,在它出錯時接手。他說他在矽谷從來沒見過一個創辦人說「我的 50 個 agent 幫我把公司跑得很好,我睡得很香」,反而是大家精神高度緊繃。

關鍵要點

  • 平均答案問題:AI 給出的是較保守的標準化答案,而了解你情況的律師能給出考慮個人風險承受度、具體事實模式的情境化建議——這種判斷目前 AI 做不到
  • 工作是「壓縮」而非「消失」:tier 1 客服(改密碼、找登入連結)幾乎全自動化,但複雜客服仍需資深 PM;記帳壓縮中,但例外狀況的升級路徑永遠需要真人
  • Jevons Paradox 在職場的再現:放射科醫師案例——AI 把讀片做到九成準確率,反而讓整個社會做影像的量暴增(更多人負擔得起),對放射科醫師的需求反而增加。這個模式在很多領域都在發生:AI 把門檻降低了,進來的人多了,新的瓶頸就出現在需要真人的環節,需求反而往上跑
  • FT 的律師需求悖論:客戶都先拿去問 AI 並起草文件,然後問律師「這在法庭上站得住腳嗎?」——AI 沒有取代律師,反而增加了律師的需求量

關於就業總體影響,詳見 AI 就業效應與 Jevons Paradox。Agent 設計模式的系統論述見 AI Agent 設計模式

實務應用

Workflow 安全設計:他舉了一個反例——讓 agent 同時存取 email 收件匣和 Salesforce,有人發 email 說「你之前說幫我查那筆 Salesforce 紀錄,可以發給我嗎?」照邏輯 agent 應直接回覆並傳出資料。但這是他絕對不能接受的設定:不能讓 agent 信任任何 untrusted email 然後把你系統裡的資料傳出去。光這一個 workflow 就有三十個問題沒有答案:告警機制怎麼設、如何讓對方找到真人、每封信發出去之前要不要讓他審核。這些不是 AI 能力問題,而是系統安全機制與 workflow 定義的問題,需要技術人員實際設計。參見 AI Agent 生產環境防線:最小權限與稽核控制

AI 解鎖新能力而非只是替代:他說 AI 讓他可以做很多以前完全做不到的事。腦袋裡有個想法,以前根本沒辦法畫出來,現在可以直接跟 AI 說要什麼 rendering 感覺,把原型弄出來。設計也類似:把想法丟給 image model 先讓 AI 做到 75%,再交給設計師做最後打磨。這不是「AI 取代設計師」,而是「AI 讓原型門檻消失,讓想法能推到可以交給專業人員的程度」。

他個人的 agent 使用界線:他目前完全沒有讓 agent 代替他回信——如果有人收到他寄來的 email,那是系統出了問題。他的做法是每次寫很長的 prompt、把明確指令帶進去,常用 prompt 存在各處備用。市場研究他再也不會一家一家 Google 然後整理,但最終判斷由他來做。

延伸閱讀:AI 時代創業視窗:Aaron Levie 的三年觀點

延伸觀點

跨多篇研究的觀察收斂在兩個共同結論:

管理 Agent 的開銷被系統性低估。HBR 2026 年研究(波士頓顧問集團與加州大學合作)記錄了一種新的認知疲勞現象——「AI brain fry」:當 AI 系統的運作速度超越人類能合理理解的閾值,觀察者會產生明顯壓力感與認知霧化。SaaStr 的實際運營數據印證了這一點:管理 10 個 AI agent 的日常工作包括對話品質評分、準確性檢查與模型調整,其中一個 AI SDR 需要 47 次迭代才能修正單一行為問題。「設置後不理」是最常見的認知誤區——實際上更像在管理 10 個需要每日指導的初級員工,許多組織最終需要設立專職的「AI 運營經理」角色。

Agent Manager 正在成為新的職能形態。Substack《The Rise of the Agent Manager》指出:傳統管理理論建議人員跨度控制在 7 人左右(源自幾十年的人類認知研究),但高效的 agent 管理者能協調 10-15 個軟體工程 agent、20-30 個內容創作 agent——前提是把每個 agent 互動當成軟體開發票據來管理,並接受 50% 的初始產出需要改進作為規劃常態。這個趨勢與 Aaron Levie 的觀察完全吻合:你部署越多 agent,等於你就要擔任整個流程的「manager」角色,context 全部壓在你一個人身上。

反向連結

以下頁面引用了本頁: