AI Agent 詞彙指南：Harness、Scaffold 與 Sub-agent 層次定義

核心概念

這篇由 Hugging Face 發布的詞彙指南（2026 年 5 月 25 日）針對 AI Agent 領域中反覆被誤用、混淆的核心術語提供明確定義。作者的出發點是：當一個領域快速發展時，詞彙的演變往往比共識更快，同一個詞在不同框架中有截然不同的意涵，導致跨團隊溝通成本上升。

Model、Scaffold、Harness：三層分離

文章最核心的區分是將 Agent 系統拆解為三個可獨立優化的層次：

Model（模型） 是 LLM 本身（如 Claude、GPT、Qwen）。職責只有一個：接受文本輸入，輸出文本。單獨執行時，模型沒有記憶、沒有循環、也無法實際執行工具——它可以「表達」調用工具的意圖，但需要外部執行層才能讓意圖成真。

Scaffolding（腳手架） 是定義模型行為的層次，包括：

System prompt（系統提示）
Tool descriptions（工具描述）
模型回應的解析規則
上下文跨步驟的管理方式

Scaffold 決定模型「怎麼看世界」以及「怎麼行動」，是行為定義層，不是執行層。

Harness（控制框架） 是實際的執行層，負責：

調用模型
處理工具調用結果
決定何時停止
使 Agent 能在環境中持續循環運行

關鍵洞察：同一個模型加上不同的 harness，可以產生截然不同的產品體驗。Claude Code、Codex 等產品常將整個系統統稱為 "harness"，但在訓練流程中，分清 scaffold 和 harness 的邊界至關重要——訓練期錯誤的 scaffold 需要重新訓練，推理期錯誤的 prompt 只需重新部署，兩者成本天差地別。

Agent = Model + Harness

文章的定義源自強化學習的原始框架：Agent 是一個函數，接受觀察值（observation），輸出動作（action）；環境接收動作後返回新的觀察值，循環持續。

在 LLM 脈絡下，Agent = Model + Harness——這個公式強調兩個可分離的組件，模型本身不會「行動」，是 harness 讓模型在真實循環中運作。一個具體的編碼 Agent 結構：

System prompt + tool descriptions + 輸出格式 = scaffolding
調用模型的循環 + 處理工具結果 + 決定何時停止 = harness

Context Engineering（上下文工程）

Agent 在每一步能看到什麼，決定了它能做什麼。上下文工程設計的對象包括：系統提示、工具描述、對話歷史、從外部知識庫檢索到的內容。隨著 Agent 運行，之前的步驟動態塑造後續調用的上下文——這使上下文管理成為獨立的工程學科。

記憶在此脈絡下分兩類：

短期記憶：單次運行內保留在上下文窗口的內容（對話歷史、工具結果、推理過程）
長期記憶：跨 session 持久化，存於外部儲存，按需注入上下文

Sub-agents 與 Orchestrator

Sub-agent 是「由另一個 Agent 調用來處理特定子任務的 Agent」，有自己的模型和 scaffold，可以獨立推理、使用工具、甚至再調用下一層 sub-agents。調用方不需要知道 sub-agent 的內部工作原理，只需取得返回結果。

三個容易混淆概念的區別：

Tool（工具）：函數調用，執行單一動作
Skill（技能）：完成目標所需的打包知識（例：「調查此錯誤、形成假設、寫修復」），可跨 agent 移植、按需加載
Sub-agent：有推理能力、可使用工具、可再調用下層 sub-agents 的完整 Agent

協調多個 Agent 的上層控制器稱為 Orchestrator（協調器）。

關鍵要點

Policy（策略） 定義 Agent 在任何情境下的行為概率分佈，一部分存在模型權重中，一部分由 scaffold 和 harness 決定。Policy 是行為的「規格」，Agent 是在環境中執行的「系統」，兩者不同。
Eval Harness（評估控制框架）：在評估時執行固定場景集合並記錄指標，不更新模型權重，用來測量 Agent 能力而非訓練能力。
訓練術語三組：
- Rollout / Trajectory / Trace：從開始到結束的一次完整 Agent 運行記錄（含 Agent 看到的、做到的、每步獲得的獎勵）
- Reward：告訴訓練算法模型是否變更好的評分。可驗證的（測試通過/失敗）、學習的（人類偏好）、稀疏的（episode 末尾）、密集的（每步一個）
- Rubrics（評分標準）：將獎勵拆解為帶權重的明確維度，而非單一數字
RL Environment（RL 環境）：接收動作、更新狀態、返回觀察值的任何可交互對象。以檔案系統為例：執行 touch foo.txt（動作）→ 文件創建（狀態更新）→ 返回更新後的文件列表（觀察值）。
詞彙混淆的根源有三：領域快速發展、同一詞在不同框架有不同用法、許多術語至今無普遍接受的定義。

實務應用

這份詞彙表的最直接應用是跨團隊溝通精確化：當有人說「改一下 harness 的邏輯」時，需要釐清他們指的是執行循環（harness），還是系統提示與工具描述（scaffold）。混淆這兩層會導致優化方向錯誤。

對構建多 Agent 系統的工程師，最重要的實務區分：

Sub-agent vs Tool：前者有推理能力和內部狀態，後者是純函數。選錯層次會帶來不必要的 latency（過度使用 sub-agent）或能力不足（把需要推理的任務做成工具）
Scaffold 的修改成本遠低於模型權重的修改成本——推理期的 prompt 錯誤只需重新部署，訓練期的 scaffold 錯誤需要重新訓練

多代理網絡的湧現風險：Microsoft Research 紅隊測試報告深入探討多 Agent 協調場景下的系統性風險，與本文 Orchestrator 和 Sub-agent 概念直接相關。MagenticLite：為小型模型優化的代理系統三層架構是這套術語的實際架構落地案例。AI Eval 成本危機：評估比訓練更貴討論 Eval Harness 的成本問題，可與本文 Eval Harness 定義對照閱讀。

延伸觀點

來自 SWE-bench 基準測試的具體數據讓 Harness 的重要性有了量化佐證：同一個模型在不同 agent harness 上的得分，從 46% 跳升至 80%（Cursor 內部研究）。這 34 個百分點的差異完全來自 harness 層的設計決策——上下文檢索策略、任務拆解方式、錯誤重試邏輯、記憶持久化方案——沒有任何模型層的改動。這個數字比大多數模型世代升級帶來的提升還要大，直接證明了 HF 詞彙指南的核心論點：harness 工程是值得獨立投入的技術學科，不只是「把模型包起來」的膠水代碼。

arXiv 的終端機原生編碼 Agent 論文（2603.05344）進一步具體化了 harness 設計的工程要素。上下文管理被定為首要瓶頸：論文提出雙記憶架構，將對話記憶（episodic）和當前推理記憶（working）分離，以限制 token 增長；並引入「事件驅動系統提醒」機制來對抗長 session 中指令遺忘的問題——這對應到 HF 詞彙指南的 Context Engineering，但更具體地指出了 scaffold 失效的時機與對策。

Harness 的安全設計方面，論文提出五層獨立防禦（prompt 護欄 → schema 限制 → 運行時審批 → 工具驗證 → 生命週期鉤子），強調每一層獨立應對一類風險，避免單點失效。這呼應了 Sub-agent 設計的隔離原則：上層 Orchestrator 不需了解 sub-agent 的內部實作，就像每一層 harness 防禦不依賴前一層一樣。

綜合兩個來源的共識：Scaffold 寫的是「規格」，Harness 決定的是「能力上限」。選擇哪個模型是第二位的問題；如何設計圍繞模型的執行層，才是現階段 AI Agent 工程的核心競爭力。

反向連結

以下頁面引用了本頁：

AI Eval 成本危機：評估比訓練更貴（文章精選）
MagenticLite：為小型模型優化的代理系統三層架構（文章精選）
多代理網絡的湧現風險：Microsoft Research 紅隊測試報告（文章精選）
HF CLI：為 AI 代理最佳化的 Hugging Face 命令列工具（文章精選）
Holo3.1：本地電腦操作代理的量化推論突破（文章精選）
hf CLI：為 AI Agent 優化的 Hub 操作介面（文章精選）
Agentic Resource Discovery：讓 AI Agent 動態搜尋工具與能力（文章精選）
CUGA：IBM Research 開源企業級代理框架與 24 個實作範例（文章精選）