Managed · Agents · 解體新書
前四卷已將本地層逐一解剖——卷壹拆 Claude Code CLI 的骨架,卷貳析 SDK 的肌理,卷參窺 API 的經脈,卷肆論 Agentic 的通用原理。然而,當迴圈、容器、工具與持久性全由你自己搭建時,每一次部署都是一場手術。卷伍登上雲端:Anthropic 的 Managed Agents 是一個託管式 agent 運行時,處於公開測試階段(header: managed-agents-2026-04-01),它將整個 harness 交由 Anthropic 代為運行——你只需定義意圖,平台負責迴圈、沙箱、工具與串流。
四個核心概念貫穿全卷:Agent(模型 + 系統提示 + 工具集)、Environment(容器模板)、Session(運行實例)、Events(雙向訊息交換)。十章解剖由淺入深——從「何謂託管」到「定價模型」——每章附圖解、程式碼與洞察,如同前四卷之體例。
本卷所有資訊均以 Anthropic 官方文件(2026 年 4 月)為準。API 端點、SDK 用法、工具集名稱、事件類型與定價數字,皆經逐一查核。
何謂託管
What is Managed — Messages API vs Managed AgentsMessages API 是一把手術刀——你自己握柄、控制角度、決定切多深。Managed Agents 是一座自動手術台——你描述手術目標,平台負責執行迴圈、管理容器、提供工具、串流結果。兩者的根本差異在於誰擁有迴圈:前者是你,後者是 Anthropic。此章以官方對照表為藍本,逐項比對兩種範式。
Paradigm 範式轉移
Messages API 如同自駕——你掌方向盤、踩油門、換車道。Managed Agents 如同叫車——你說目的地,平台負責駕駛。兩者底層都是 Claude 模型,但操控權的歸屬決定了架構的根本形態。
When to Choose 何時選擇
需要極致控制、自訂迴圈邏輯、特殊工具整合?Messages API。需要快速部署、無需管理基礎設施、希望開箱即用的 bash/檔案/搜尋工具?Managed Agents。兩者可並存於同一產品中。
代理人定義
POST /v1/agents — Define the Agent
一切始於 POST /v1/agents。Agent 是一份不可變的定義:指定模型(如 claude-sonnet-4-20250514)、系統提示詞、以及工具集。每次建立都產生一個 agent.id 與 agent.version,如同一份蓋章的處方——內容不可竄改,但可以新建版本。工具集 agent_toolset_20260401 內建 bash、檔案操作、網頁搜尋/擷取,並可掛載 MCP servers。
agent_toolset_20260401 是目前唯一的內建工具集,包含 bash、檔案讀寫、web search、web fetch。日後版本將以日期遞增。
mcp_servers 陣列可掛載外部 MCP 伺服器,為 agent 擴展任意工具能力。
環境配置
POST /v1/environments — Container Template
Agent 定義「做什麼」,Environment 定義「在哪裡做」。POST /v1/environments 建立一個容器模板,指定網路策略(unrestricted 或 restricted + 白名單)與預裝套件。每個 session 啟動時,都會從此模板生成一個隔離的容器實例。環境也是不可變的——修改即建新版。
Isolation 隔離性
每個 session 的容器彼此完全隔離——檔案系統、程序空間、網路命名空間各自獨立。一個 session 的 rm -rf / 不會影響其他 session。這是 Managed Agents 的核心安全保障。
Networking 網路策略
unrestricted 允許容器存取全部網路——適合需要拉取任意依賴的開發任務。restricted 搭配 allowed_domains 白名單——適合生產環境,限制 agent 只能存取你信任的服務。
會話開啟
POST /v1/sessions — Launch and Lifecycle
Agent + Environment = 定義。Session = 運行實例。POST /v1/sessions 引用 agent ID 與 environment ID,Anthropic 即啟動一個容器、載入工具、進入 agentic 迴圈。Session 有明確的生命週期:created → active → idle → (更多事件) → ended。每個 session 持續計費($0.08/session-hour),直到你主動結束或系統逾時。
session.status_idle 事件,等待你發送下一個 user.message。
事件交響
Events & Streaming — the Bidirectional Protocol
Session 的靈魂是事件。你透過 POST /v1/sessions/{id}/events 發送 user.message;你透過 GET /v1/sessions/{id}/stream 以 SSE 接收 agent 的回應——包括 agent.message(文字)、agent.tool_use(工具呼叫)與 session.status_idle(完成等待)。這是一個非對稱的雙向協議:POST 送出,SSE 接收,兩條路徑各司其職。
Asymmetric 非對稱協議
你透過 POST 發送事件(同步請求),透過 GET 接收事件(長連線 SSE)。這不是 WebSocket——而是一條 HTTP POST 加一條 SSE stream,兩條路徑分離。你的 SSE 連線應在 session 開始時建立,並持續監聽直到 session 結束。
Idle Signal 閒置信號
session.status_idle 是你判斷「agent 做完了」的信號。收到此事件後,你可以發送新的 user.message 繼續對話,或決定結束 session。在 idle 期間,容器仍然存活,檔案系統保持原狀——這是多輪互動的基礎。
工具全譜
Agent Toolset
Messages API 要求開發者逐一定義 tools[];Managed Agents 則以單一
agent_toolset_20260401 聲明一次注入全部能力。此工具集涵蓋四大類別——
Shell 執行、檔案操作、網路存取、以及外部 MCP 伺服器連接——讓 agent 在容器內擁有
與 Claude Code 對等的操作面。每個類別獨立授權,可於 environment 層級啟用或停用。
bash — 完整 shell 存取,執行任意命令。等同 Claude Code 的 Bash 工具,
在容器內運行,具備完整 Linux 環境。
read、write、edit(差異替換)、
glob(模式搜尋)、grep(內容搜尋)。
web_search 搜尋網路、web_fetch 抓取頁面。
mcp_servers[] 連接外部 MCP 伺服器以擴展工具面。
串流與操控
Streaming & Steering
傳統 API 呼叫是「送出、等待、接收」的單次往返。Managed Agents 的串流架構則開啟了
一條持續的 SSE(Server-Sent Events)通道:客戶端透過
GET /v1/sessions/{id}/stream 建立連線,伺服器持續推送事件——
agent.message(文字串流)、agent.tool_use(工具呼叫)、
直到 session.status_idle 標誌任務完成。更關鍵的是,客戶端可在 agent
工作期間隨時送入新的 user.message 事件來「操控」方向——中途糾正、
補充資訊、甚至完全改變任務目標。
Why SSE? 為何選 SSE
SSE 是 HTTP 原生的單向推送協議,相較 WebSocket 更易穿透防火牆與負載均衡器。 Managed Agents 透過 SSE 下行推送事件,再以普通 POST 上行接收 steering 指令—— 這種「半雙工 + REST 補充」的設計,兼顧了即時性與簡單性。
Steering 操控模式
傳統對話必須等 agent 回覆後才能送出下一輪訊息。Steering 打破了這個限制—— agent 正在執行 bash 命令時,你可以送入「改用 Python 而非 Go」, agent 會在下一個決策點讀取並調整行為。這是真正的人機協作迴路。
容器與持久
Containers & Persistence每個 Managed Agent session 都在一個隔離的容器中執行。容器由 environment 定義的模板 建立,預裝 Python、Node.js、Go 等常見語言執行環境。容器內的檔案在同一 session 的 多次對話間持久存在——agent 第一輪寫入的程式碼,第二輪仍可讀取和修改。更重要的是, session 本身具備持久性:即使客戶端斷線重連,agent 的狀態和容器內容都不會遺失。 透過 checkpointing 機制,系統可在需要時快照和還原容器狀態。
main.py,
第三輪仍可 read 讀取、edit 修改。
GET /stream
即可繼續接收事件——無需重建 session 或重跑工作。
進階能力
Advanced Features — Research PreviewManaged Agents 平台提供三項研究預覽功能,目前需要申請存取權限。 Outcomes 讓你為 agent 定義明確的成功準則,系統會據此評估任務是否完成; Multiagent 支援多個 agent 之間的協調與通訊,實現任務分工; Memory 則提供跨 session 的持久記憶,讓 agent 能從歷史互動中學習。 這三項能力分別對應了 agent 系統的三大缺口——目標量化、水平擴展、長期學習。
Why Research Preview? 為何是研究預覽
這三項能力涉及 agent 自主性的根本提升——自我評估成果、協調同僚、跨時段學習。 Anthropic 選擇以研究預覽形式發布,一方面收集真實使用回饋,一方面逐步完善 安全護欄。申請存取可透過 Anthropic Dashboard 提交。
Implications 意涵
Outcomes 將 agent 從「盡力而為」推向「可驗證完成」;Multiagent 將單體 agent 擴展為分散式團隊;Memory 則打破了 session 間的遺忘邊界。這三者組合, 描繪出一條從工具型 AI 到自主型 AI 的演進路徑。
選型與定價
Choosing & Pricing
Anthropic 的 Claude 生態已形成五層堆疊:最底層是理論與原理(卷壹至肆),
之上是 Managed Agents(本卷),再上是 Messages API、Agent SDK、最頂層則是
Claude Code 本身。每一層都在下一層之上增加抽象與便利——但也增加了成本與限制。
選擇哪一層,取決於你對控制力、便利性、與成本的權衡。Managed Agents 的定價模型
為標準 token 費用加上 $0.08/session-hour 的容器運算費。
速率限制為每分鐘 60 次建立、每分鐘 600 次讀取。
When Managed Agents? 何時選用
當你需要 agent 在雲端長時間自主工作、不想管理容器基礎設施、需要 session 持久性 與斷線恢復、且希望內建代碼執行與檔案操作時——Managed Agents 是最直接的選擇。 若你需要完全控制工具定義和執行環境,則 Messages API 更適合。 若你需要本地互動式開發,Claude Code 或 Agent SDK 更為合適。
Cost Anatomy 成本結構
$0.08/session-hour 的容器費用意味著一個持續 1 小時的 agent session 額外成本不到一杯咖啡的十分之一。真正的成本大頭仍在 token 消耗—— 長時間運行的 agent 可能產生大量工具呼叫和思考過程,累積可觀的 token 費用。 合理的 system prompt 與 outcome 定義能有效控制成本。