AI Agent 術語解析：Model、Harness、Scaffold 的精確定義

核心概念

AI Agent 領域在過去兩年快速膨脹，帶來的副作用之一是術語混用：「Agent」、「Scaffolding」、「Harness」在不同文章裡可能指向完全不同的東西。Hugging Face 於 2026 年 5 月發表這篇詞彙表，試圖為最常被混淆的概念建立可操作的精確定義。

Model（模型）

模型是 LLM 本身——Claude、GPT、Qwen 等等。它接受文字輸入、產出文字輸出。單獨存在時，模型沒有跨呼叫的記憶，也沒有執行迴圈。 把模型誤認為 Agent，是許多系統設計失誤的起點。

Scaffolding（鷹架）

Scaffolding 是圍繞在模型外側、定義其行為的那一層，包含：

System prompt（指令模板）
Tool descriptions（工具描述與 schema）
Response parsing（輸出解析規則）
Context management（決定模型能看到什麼歷史）

Scaffolding 的本質是「告訴模型如何扮演它的角色」，它是靜態的定義層，在 Agent 真正執行之前就已建構完成。

Harness（執行框架）

Harness 是讓 Agent 實際運行的執行層，負責：

呼叫模型
執行工具呼叫（Tool Use）
決定何時停止
管理 Agent 的迴圈邏輯

Harness 是動態的執行層，在 runtime 驅動整個 Agent 的生命週期。一個重要的區分：Scaffolding 說「模型應該做什麼」，Harness 說「現在執行它」。

Agent（代理）

完整定義：Agent = Model + Harness（+ Scaffolding）

這個組合體能夠接收觀察（observation）、決定行動（action）、在迴圈中持續執行——把原本只輸出文字的語言模型，轉化為能在真實環境中採取行動的系統。缺少其中任何一層，就不是 Agent，只是被呼叫的 LLM。

Context Engineering（上下文工程）

Context Engineering 是設計「什麼資訊進入 Agent 的 context window」的工程學科，管轄範圍包含：

System prompt 的結構
Tool descriptions 的精簡程度
對話歷史的保留策略
從外部知識庫檢索（RAG）帶入的內容

它貫穿整個 Agent 執行過程，而非一次性設定。

Tool Use（工具使用）

Agent 透過 Tool Use 與外部系統互動——API、程式碼直譯器、資料庫、網頁搜尋等。其機制是：Agent 表達結構化的執行意圖（intent），由 Harness 實際呼叫並回傳結果。模型本身不直接操作工具，它只是「說」想用什麼工具。

Skills 與 Sub-agents

Skills：可重用的結構化能力包，把多步驟任務的知識打包，比單一工具更完整，但不具備自己的推理能力。
Sub-agents：被其他 Agent 呼叫來處理子任務的完整 Agent，擁有自己的模型、Scaffolding 與推理能力。

兩者的分界在於 Sub-agent 能自主推理，Skills 只是執行範本。

訓練專用術語

術語	定義
RL Environment	接受 action 輸入、回傳 observation 的有狀態物件
Trainer	執行 episodes、評分、更新模型權重的訓練驅動器
Rollout	一次完整的 Agent 執行（從開始到結束），亦稱 trajectory 或 trace
Reward	評估模型是否進步的分數（可驗證 / 學習型 / 稀疏 / 稠密）

關鍵要點

Model ≠ Agent：模型只是組件之一，缺乏 Harness 就無法自主行動
Scaffolding 是靜態定義，Harness 是動態執行：兩者常被混用，但職責完全不同；關於這個差異的詳細工程實踐見 Harness Engineering
Context Engineering 是一等公民：設計進入 context window 的資訊，是決定 Agent 品質的核心變數，不亞於模型本身的能力
Skills 不是 Sub-agents：Skills 無自主推理能力，Sub-agents 有自己完整的 Agent 堆疊
術語不統一是現實：作者明確指出這份詞彙表的目標是建立「可操作的心智模型」，而非強制標準化——理解概念比對齊用詞更重要

實務應用

設計 Agent 系統時，可用這個框架做架構檢查：

Model 選型：依任務複雜度選 LLM，不要把模型能力與系統能力混為一談
Scaffolding 先行：清楚定義 system prompt、tool schema，再設計 Harness 的執行邏輯；參考 Thin Harness, Fat Skills — Garry Tan AI 效能架構的精簡 Harness 原則
Harness 邊界：Harness 負責執行，不應混入業務邏輯；業務邏輯應包裝成 Tool 或 Skill
Context budget：把 context window 視為有限資源，主動管理而非填滿；詳細落地障礙見 Agentic AI 企業落地現實：基礎建設障礙與突破策略
Sub-agent 判斷標準：子任務需要獨立推理 → Sub-agent；子任務是固定步驟 → Skill；避免過度分解

延伸觀點

結合 Hugging Face 另一篇《Dynamic Context Engineering for AI Agents》以及 arXiv 論文《Building AI Coding Agents for the Terminal》的交叉驗證，三個觀點在兩篇以上來源重複出現：

1. Harness / Scaffolding 的靜動分界已成共識

優先來源的 arXiv 論文明確指出：Scaffolding 在第一個 prompt 發出前組裝完成（system prompt、tool schema、subagent registry），Harness 在 runtime 負責 tool dispatch、context 管理、安全執法與跨輪次狀態持久化。這與 Hugging Face 詞彙表的定義高度一致，說明這個分界正在成為行業共識，而非單一視角。

2. Context Engineering 是架構問題，不是提示詞問題

《Dynamic Context Engineering》提出「五個認知層次」框架：記憶分層（短期/長期）、context window 管理（reactive vs. deliberative）、推理棧容量（非線性退化）、現實世界約束、符號知識表徵。核心論點是：context 管理需要不同的工程策略對應不同的認知層次，不能用一個靜態 system prompt 解決所有問題。這強化了「Context Engineering 是一等公民」的結論。

3. Agent Loop 的六相模型正在取代簡單 ReAct

arXiv 論文提出 extended ReAct 的六個階段：pre-check/compaction → thinking → self-critique → action → tool execution → post-processing，在傳統觀察-思考-行動之外，加入了預壓縮與自我批判兩個環節，以應對有限 context window 的現實限制。與 Hugging Face 詞彙表的 observation → action → execution 基本迴圈相比，這是一個更貼近生產環境的具體實作。

延伸資料：AI Agent 設計模式、多 Agent 系統協作架構：MCP 與 A2A 協議

反向連結

以下頁面引用了本頁：

AI Agent 設計模式（技術與AI）
Agentic AI 企業落地現實：基礎建設障礙與突破策略（技術與AI）
Harness Engineering（技術與AI）
Thin Harness, Fat Skills — Garry Tan AI 效能架構（技術與AI）
多 Agent 系統協作架構：MCP 與 A2A 協議（技術與AI）
CUGA：IBM 開源代理 Harness 的 24 個真實應用實踐（文章精選）