Vivian Balakrishnan 的 AI 第二大腦——外交官的個人代理架構

核心概念

新加坡外交部長 Vivian Balakrishnan 在 2026 年 5 月的 AI Engineer Singapore 大會上分享了一件不尋常的事：他親手組了一套個人 AI 助理，跑在一台只有 8GB 記憶體的 Raspberry Pi 上。他是退休眼科外科醫師出身，自稱不會寫程式，連 vibe coding 都不敢自稱——他做的是「組裝工具」。但他做出來了，用了三個月之後說已經不敢把它關掉。

為什麼一個外長需要這套系統？ 他的職務決定了認知負荷的規模：一個月造訪 12 個國家、見上百個人，每到一個地方都得掌握當地的經濟、地理、歷史、文化，還有戰爭與和平。他要一套系統，讓需要資訊的時候隨時拿得到，需要深究的時候還能順著線追下去。

系統架構：NanoClaw 作為底層

他選擇 NanoClaw 作為核心框架，理由有三：程式碼短（約 500 行）、連他都能讀完；容器化設計，出錯維持在邊界之內；幾乎沒有設定檔，客製化全部交給 LLM，每個人跑出來的系統長得都不一樣。NanoClaw 建在 Anthropic Claude Agent SDK 上，可接 WhatsApp、Telegram、Slack，有記憶，也能排程。這正是 Thin Harness, Fat Skills — Garry Tan AI 效能架構所說的「薄框架」——最小化固定程式碼，最大化模型能力空間。

對話介面用 Baileys（模擬 WhatsApp 瀏覽器行為的軟體），讓 Agent 透過 WhatsApp 對話。記憶層用 Mnemon，一套以圖譜結構儲存實體與關係（因果、時間、語意）的記憶系統，類似 AI 輔助知識管理裡的圖譜式知識儲存邏輯。為了不被關鍵字搜尋綁死，他在本機跑 Ollama 加嵌入模型，內建語意搜尋。語音交給 Whisper，讓他能說話、系統也能說回來。wiki 層接上 Obsidian，透過 iCloud 同步，走到哪都帶得走。

他把自己的講稿、國會逐字稿餵進 Mnemon，讓系統抽取消化存進記憶，再套用 Karpathy 提出的 LLM 監督式 wiki 生成流程（詳見 AI 知識庫典範比較——Karpathy、Lütke 與 Tan），讓知識庫自動生長。三個月實測，他說這套東西在見人、出差、擬初稿這些事情上都極有用，連這場演講的投影片都是 Claude 生成的。

三個核心訊息

一、理解無法外包。 計算、記憶、知識傳播都可以外包，但理解本身外包不掉。身處有權力的位置，工作可以授權，但問責授權不掉。這解釋了他為什麼堅持讀每次 Agent 請求 bash 權限時的那段程式碼——就算不會寫，能看懂發生了什麼，就保住了問責的底氣。

二、價值在地面層創造。 他引劍橋 ML 教授 Neil Lawrence 的論點：真正的經濟價值不在模型、資料中心或政策層，而在每個工作流程、每個個人——老師、律師、技師、部長，懂自己這份工作又被工具加持的人。這和 AI Agent 設計模式強調的「任務嵌入」邏輯一致：Agent 的價值在於嵌入真實工作流程，而非獨立運作。

三、入門門檻已崩塌。 他做這套系統沒有寫 Claude、沒有寫 Baileys、沒有寫 Mnemon、沒有寫 Whisper，他做的是組裝。每個人都應該展開自己的個人實驗，而且現在就可以。

關鍵要點

小系統的優勢：NanoClaw 的程式碼量讓非工程師也能完整閱讀，「讀得懂」是擁有控制感與問責能力的前提條件
記憶是前沿難題：Balakrishnan 特別強調記憶是目前 AI 最大、最未解決的問題，也是「非常人性」的挑戰——Mnemon 圖譜式儲存是他目前的解法之一，但他認為記憶的前沿仍未定型
安全設計：只把已公開發表的資料餵進系統，讓整套系統維持可審查的透明度；系統被駭，最多只會拿到已公開的外交政策摘要
工具比模型重要：他的判斷是工具的重要性超過底層模型，個人化、去中心化的工具才是他看好的方向；並對 NanoClaw 開發者公開提出要求：在 6 月 15 日前讓所有模型成為一等公民
LLM 有其邊界：Token 有成本、算力有限，不要把每個步驟都丟給 LLM；確定性系統與專家規則系統仍有其角色；他認為最終答案可能是神經符號系統（neural-symbolic systems），對 Yann LeCun 的路徑有幾分認同
你沒辦法治理一個你只被簡報過的技術：這是 Claude 幫他生成的一句話，他特別引用來告誡政府同僚——親手操作與被動接受簡報，理解深度完全不在同一層次

實務應用

外交情報準備：把訪問國的歷史、地緣、談判對手資料餵入 Mnemon，讓 Agent 在需要時語意召回，不依賴事前整理的靜態簡報
國會答覆起草：把整場國會辯論餵給 AI，生成提問與答覆草稿，部長審閱後修改；他實測發現部分 AI 生成的辯論質量令他印象深刻
雙機並行策略：NanoClaw v1 升 v2 時轉換不順，他讓舊版繼續跑在 Raspberry Pi，新版另裝到別台機器，每天用最兇的還是舊版——這不是保守，是容錯設計
個人 wiki 生成：透過 Karpathy 的 LLM 監督式 wiki 方法，把自己的演講、議事記錄、閱讀筆記自動整理成 Obsidian wiki，成為可追蹤的知識資產

延伸觀點

容器隔離是個人代理安全的必要條件，不只是可選項。 NanoClaw 和 OpenClaw 生態都以 Linux 容器作為執行環境，讓 Agent 的檔案系統存取被限制在明確邊界內。Balakrishnan 選擇 NanoClaw 的理由之一正是這點——外科醫師的直覺是「東西一定會壞，讓它壞在可控的範圍裡」。這和企業 shadow IT 的風險邏輯一致：個人代理若缺乏隔離設計，洩漏的邊界就是整台機器。

記憶架構的投資報酬可能超過模型升級。 2026 年的研究（Memory for Autonomous LLM Agents, arXiv）顯示，在多會話任務中，有記憶架構的 Agent 比僅靠長上下文的 Agent 性能高出 35% 以上。這印證了 Balakrishnan 為什麼把 Mnemon 放在系統核心，而不是只依賴 LLM 的上下文視窗。語意相似性搜尋無法捕捉因果關係是關鍵限制，圖譜式儲存（Mnemon 的設計）正是針對這個缺口——節點之間儲存的是因果、時序、語意關係，不只是文字向量。

個人代理的真正優勢是主權，不只是成本。 商業 Agent 訂閱月費約 20 美元，而自架個人代理的算力成本約 2-3 美元——但更關鍵的差異是，商業代理的記憶與資料存在第三方伺服器，行為邊界由廠商定義。Balakrishnan 只餵入已公開資料的安全策略，本質上是在利用主權優勢：他掌控邊界，也掌控問責鏈。

反向連結

以下頁面引用了本頁：

AI Agent 設計模式（技術與AI）
AI 知識庫典範比較——Karpathy、Lütke 與 Tan（技術與AI）
AI 輔助知識管理（技術與AI）
Thin Harness, Fat Skills — Garry Tan AI 效能架構（技術與AI）