核心概念

AI Agent 是指能夠自主決策、執行多步驟任務、並根據結果調整行為的 AI 系統。與傳統 LLM 問答不同,Agent 擁有目標導向的規劃能力、持久記憶,以及對外部工具的調用權。Anthropic 將 Agentic 系統定義為具備以下四個特徵:獨立決策、目標導向規劃、從互動中持續學習、以及跨整合系統的複雜推理。

四層基礎架構

現代 AI Agent 系統通常由四個核心層組成:

層級 職責
Model 層 底層語言模型,提供推理與語言理解能力
Memory 層 儲存短期(對話上下文)與長期(語義記憶)資訊
Tools 層 可調用的外部能力(搜尋、API、程式執行)
Orchestrator 層 協調多個 Agent、執行策略、強制執行政策

這四層的完整組合,將孤立的 LLM 呼叫轉變為可擴展、可問責的作業系統。其中 Memory 層尤為關鍵:短期記憶(對話窗口)負責任務內的連貫性,長期記憶(向量資料庫)讓 Agent 在跨任務間保持學習積累。

三種架構類型

1. 單體 Agent(Monolithic Single Agent) 一個 LLM 配備多種工具,簡單直接。然而存在「工具爆炸」問題——每個 Agent 超過 10-20 個工具後,性能與可靠性明顯下降,工具選擇容易出錯。適合快速原型驗證,不適合生產環境長期運行。

2. 多 Agent 工作流(Agentic Workflows) 多個專門化 Agent 組成有向圖,每個節點負責特定子任務(研究、程式執行、品質評估等)。支援並行處理與成本優化,是目前企業生產環境的主流模式。代表性框架:LangGraph、AutoGen、CrewAI。

3. LLM Skills(技能注入) 將可重用的模組化能力動態注入核心 LLM。Anthropic 的 Agent Skills 是代表案例——打包知識與可選腳本,減少工具重疊、降低認知負擔,同時保持組合性。適合需要持續注入領域專業的場景。

當前趨勢

2025 年後,業界已轉向混合架構:以有序工作流負責協調(確保可靠性),以技能注入處理領域知識(確保靈活性)。純單體設計逐漸被淘汰,模組化多 Agent 的組合成為標準,對應到協調框架如 AGNTCY 與語義記憶層如 Mem0 的興起。

關鍵要點

固定工作流模式(六種)

基於 Anthropic 實戰建議,固定工作流模式適合結構可預測的任務

模式 核心機制 典型場景
Augmented LLM 為 LLM 加上記憶、檢索、工具 大多數 AI 應用的基礎層
Prompt Chaining 有序步驟串連,前步輸出為後步輸入 需高精度、可接受延遲的任務
Routing 分類輸入後導向對應專門模型 輸入類型明確且差異顯著
Parallelization 多 LLM 同時執行後彙總 獨立子任務、多角度評估
Orchestrator-Workers 中心 LLM 動態分解後委派子 LLM 子任務難以事先預知的複雜工作
Evaluator-Optimizer 生成 LLM + 評估 LLM 迭代優化 有明確品質標準(數學、程式碼)

動態 Agent 模式

Agent 採取行動 → 評估結果 → 調整下一步,形成反饋迴圈。適用於開放式任務(電腦操作、長期研究),但需要容錯設計——錯誤會在迴圈中累積放大,需設定最大迭代次數或人工介入觸發點。

設計核心原則

「找到最簡單可行的方案,只在確實需要時才增加複雜度。」——Anthropic

複雜多 Agent 框架帶來的協調成本與除錯難度往往被低估。Google Deep Research 等強大 Agent 使用的仍是簡單底層架構——靠的是高能力的模型與可靠的工具,而非複雜的 orchestration 邏輯。

實務應用

選擇模式的決策框架:

  • 任務結構可預測 → Prompt Chaining 或 Parallelization
  • 輸入類型差異大 → Routing(避免單一通用 Agent 承擔所有輸入)
  • 需要反覆品質優化 → Evaluator-Optimizer(自動迭代直到達標)
  • 子任務無法事先預知 → Orchestrator-Workers
  • 完全開放式目標 → 動態 Agent Pattern(需設計容錯機制)

工具數量警戒線:單個 Agent 工具超過 15 個時,應重構為多 Agent 架構,將工具按職責分組到不同專門 Agent。

記憶設計警示:只有短期記憶的 Agent 在長任務中會「失憶」,導致重複工作或前後矛盾。重要 Agent 系統應搭配向量資料庫作長期記憶儲存。

延伸觀點

來自學術研究的三個補充視角:

多 Agent 系統的量化優勢:AWS 企業實驗(2024)顯示,相較於單一 Agent,多 Agent 協作在目標達成率上可提升高達 70%。關鍵機制是 Supervisor Agent 架構——中央 Agent 負責任務路由,子 Agent 保持專注領域——並搭配動態路由(繞過不必要的協調步驟),達到 ≥90% 的路由準確率、同時降低延遲。

幻覺級聯(Hallucination Cascade)是多 Agent 的隱性風險:多篇研究一致指出,單 Agent 的幻覺在多 Agent 系統中會沿有向圖向下傳播放大。預防策略包括:在每個 Agent 的輸出邊界加入驗證步驟(assertion checks)、限制 Agent 間的上下文傳遞深度,以及為關鍵節點加入人工確認機制。

MCP 作為跨 Agent 上下文共享的標準化解法:Model Context Protocol(MCP)的設計目標是解決「斷裂模型問題」——LLM 本身無法跨任務維持持久狀態。MCP 以五大原則(互通性、簡潔性、可擴展性、安全優先、人類中心控制)定義跨 Agent 的標準資源存取與記憶共享介面,目前已成為多 Agent 生態的新興標準。

Harness Engineering LLM主流地位與替代路徑

反向連結

以下頁面引用了本頁: