DOCMGA-解體-005
REV2026.04
SUBJECTMANAGED AGENTS
VOLUMEV
BETA2026-04-01
Kaitai Shinsho · Volume V · the hosted harness

Managed · Agents · 解體新書

a ten-chapter dissection of Anthropic's hosted agent runtime · public beta · April 2026
AGENTS ENVIRONMENTS SESSIONS EVENTS TOOLS STREAMING STEERING CONTAINERS MULTIAGENT PRICING
SURGEONCLAUDE
DRAFTED2026.04.09
FORMATSCROLL-HTML
VERIFIEDOFFICIAL DOCS
CHAPTERS10 + 序

前四卷已將本地層逐一解剖——卷壹拆 Claude Code CLI 的骨架,卷貳析 SDK 的肌理,卷參窺 API 的經脈,卷肆論 Agentic 的通用原理。然而,當迴圈、容器、工具與持久性全由你自己搭建時,每一次部署都是一場手術。卷伍登上雲端:Anthropic 的 Managed Agents 是一個託管式 agent 運行時,處於公開測試階段(header: managed-agents-2026-04-01),它將整個 harness 交由 Anthropic 代為運行——你只需定義意圖,平台負責迴圈、沙箱、工具與串流。

四個核心概念貫穿全卷:Agent(模型 + 系統提示 + 工具集)、Environment(容器模板)、Session(運行實例)、Events(雙向訊息交換)。十章解剖由淺入深——從「何謂託管」到「定價模型」——每章附圖解、程式碼與洞察,如同前四卷之體例。

本卷所有資訊均以 Anthropic 官方文件(2026 年 4 月)為準。API 端點、SDK 用法、工具集名稱、事件類型與定價數字,皆經逐一查核。

I.

何謂託管

What is Managed — Messages API vs Managed Agents
CH 01 / 10
COMPARISON
PARADIGM SHIFT

Messages API 是一把手術刀——你自己握柄、控制角度、決定切多深。Managed Agents 是一座自動手術台——你描述手術目標,平台負責執行迴圈、管理容器、提供工具、串流結果。兩者的根本差異在於誰擁有迴圈:前者是你,後者是 Anthropic。此章以官方對照表為藍本,逐項比對兩種範式。

Messages API Managed Agents 誰擁有迴圈? 基礎設施 工具 持久性 串流 定價 YOU BUILD THE LOOP YOUR SERVERS / CONTAINERS YOUR OWN TOOL IMPLEMENTATIONS YOUR OWN STATE MANAGEMENT IMPLEMENT SSE YOURSELF TOKEN PRICING ONLY ANTHROPIC RUNS THE LOOP HOSTED CONTAINERS PROVIDED AGENT_TOOLSET_20260401 BUILT-IN SESSION = PERSISTENT INSTANCE SSE STREAMING BUILT-IN TOKENS + $0.08 / SESSION-HOUR
Paradigm 範式轉移

Messages API 如同自駕——你掌方向盤、踩油門、換車道。Managed Agents 如同叫車——你說目的地,平台負責駕駛。兩者底層都是 Claude 模型,但操控權的歸屬決定了架構的根本形態。

When to Choose 何時選擇

需要極致控制、自訂迴圈邏輯、特殊工具整合?Messages API。需要快速部署、無需管理基礎設施、希望開箱即用的 bash/檔案/搜尋工具?Managed Agents。兩者可並存於同一產品中。

II.

代理人定義

POST /v1/agents — Define the Agent
CH 02 / 10
AGENT
MODEL + SYSTEM + TOOLS

一切始於 POST /v1/agents。Agent 是一份不可變的定義:指定模型(如 claude-sonnet-4-20250514)、系統提示詞、以及工具集。每次建立都產生一個 agent.idagent.version,如同一份蓋章的處方——內容不可竄改,但可以新建版本。工具集 agent_toolset_20260401 內建 bash、檔案操作、網頁搜尋/擷取,並可掛載 MCP servers。

你的應用 YOUR APP POST /v1/agents 請求主體 Request Body name "my-coding-agent" model "claude-sonnet-4-20250514" system "You are a coding assistant..." tools [ { "type": "agent_toolset_20260401" } ] mcp_servers [ { "url": "https://..." } ] OPTIONAL: max_tokens, temperature, ... 200 OK 回應 Response id agent_01JQ... version agver_01JQ... created_at 2026-04-09T... agent_toolset_20260401 BASH · FILE OPS · WEB SEARCH · WEB FETCH · MCP
1Agent 不可變 每次 POST 建立一個新的 version。修改 system prompt 或工具?重新 POST,取得新 version ID。
2工具集版本化 agent_toolset_20260401 是目前唯一的內建工具集,包含 bash、檔案讀寫、web search、web fetch。日後版本將以日期遞增。
3MCP 掛載 透過 mcp_servers 陣列可掛載外部 MCP 伺服器,為 agent 擴展任意工具能力。
III.

環境配置

POST /v1/environments — Container Template
CH 03 / 10
ENVIRONMENT
NETWORKING + PACKAGES

Agent 定義「做什麼」,Environment 定義「在哪裡做」。POST /v1/environments 建立一個容器模板,指定網路策略(unrestrictedrestricted + 白名單)與預裝套件。每個 session 啟動時,都會從此模板生成一個隔離的容器實例。環境也是不可變的——修改即建新版。

Environment 環境模板 POST /v1/environments 網路策略 Networking type: "unrestricted" 容器可存取全部網路 type: "restricted" + allowed_domains: [...] 預裝套件 Packages pre_installed_packages: - "python3" - "nodejs" - "git", "curl", ... Session A ISOLATED CONTAINER Session B ISOLATED CONTAINER Session C ISOLATED CONTAINER 每個 session 生成獨立容器 RESPONSE: { "id": "env_01JQ...", "version": "envver_01JQ...", "created_at": "..." }
Isolation 隔離性

每個 session 的容器彼此完全隔離——檔案系統、程序空間、網路命名空間各自獨立。一個 session 的 rm -rf / 不會影響其他 session。這是 Managed Agents 的核心安全保障。

Networking 網路策略

unrestricted 允許容器存取全部網路——適合需要拉取任意依賴的開發任務。restricted 搭配 allowed_domains 白名單——適合生產環境,限制 agent 只能存取你信任的服務。

IV.

會話開啟

POST /v1/sessions — Launch and Lifecycle
CH 04 / 10
SESSION
LIFECYCLE STATES

Agent + Environment = 定義。Session = 運行實例。POST /v1/sessions 引用 agent ID 與 environment ID,Anthropic 即啟動一個容器、載入工具、進入 agentic 迴圈。Session 有明確的生命週期:created → active → idle → (更多事件) → ended。每個 session 持續計費($0.08/session-hour),直到你主動結束或系統逾時。

POST /v1/sessions { agent_id, environment_id } created 容器啟動中 active AGENT 執行中 idle 等待指令 更多事件 → 再次 active ended 容器銷毀 計費期間 $0.08/session-hour BILLING WINDOW: CREATED → ENDED TIME →
1created → active 容器啟動完成,agent 開始處理第一個事件。此過程通常數秒內完成。
2active → idle agent 完成當前指令,發出 session.status_idle 事件,等待你發送下一個 user.message
3idle → active → idle ... Session 可在 idle 與 active 間反覆循環。容器與檔案系統跨輪次持久——之前建立的檔案、安裝的套件依然存在。
V.

事件交響

Events & Streaming — the Bidirectional Protocol
CH 05 / 10
EVENTS
SSE + POST

Session 的靈魂是事件。你透過 POST /v1/sessions/{id}/events 發送 user.message;你透過 GET /v1/sessions/{id}/stream 以 SSE 接收 agent 的回應——包括 agent.message(文字)、agent.tool_use(工具呼叫)與 session.status_idle(完成等待)。這是一個非對稱的雙向協議:POST 送出,SSE 接收,兩條路徑各司其職。

你的應用 YOUR APP SEND + LISTEN Session 會話 ANTHROPIC HOSTED CLAUDE MODEL AGENT_TOOLSET CONTAINER FILE SYSTEM AGENTIC LOOP EVENT STREAM POST /v1/sessions/{id}/events SEND: user.message GET /v1/sessions/{id}/stream RECEIVE: SSE EVENT STREAM user.message agent.message agent.tool_use session.status_idle ↑ 你發送 · ↓ 你接收 · SSE 事件類型一覽
Asymmetric 非對稱協議

你透過 POST 發送事件(同步請求),透過 GET 接收事件(長連線 SSE)。這不是 WebSocket——而是一條 HTTP POST 加一條 SSE stream,兩條路徑分離。你的 SSE 連線應在 session 開始時建立,並持續監聽直到 session 結束。

Idle Signal 閒置信號

session.status_idle 是你判斷「agent 做完了」的信號。收到此事件後,你可以發送新的 user.message 繼續對話,或決定結束 session。在 idle 期間,容器仍然存活,檔案系統保持原狀——這是多輪互動的基礎。

VI.

工具全譜

Agent Toolset
agent_toolset_20260401
unified tool surface
bash · files · web · mcp

Messages API 要求開發者逐一定義 tools[];Managed Agents 則以單一 agent_toolset_20260401 聲明一次注入全部能力。此工具集涵蓋四大類別—— Shell 執行、檔案操作、網路存取、以及外部 MCP 伺服器連接——讓 agent 在容器內擁有 與 Claude Code 對等的操作面。每個類別獨立授權,可於 environment 層級啟用或停用。

agent_toolset_20260401 Shell 執行 bash bash — 完整 shell 存取 檔案操作 file ops read write edit glob grep 網路存取 web web_search web_fetch 外部伺服器 mcp servers mcp_servers[] 自訂工具擴展 容器環境 · Python, Node.js, Go, Rust 預裝 container environment — pre-installed packages 每項工具可於 environment 定義時獨立啟用或停用 TOOLS ARE SCOPED PER ENVIRONMENT · ENABLE / DISABLE INDIVIDUALLY
1Shell 執行 bash — 完整 shell 存取,執行任意命令。等同 Claude Code 的 Bash 工具, 在容器內運行,具備完整 Linux 環境。
2檔案操作 五大檔案工具:readwriteedit(差異替換)、 glob(模式搜尋)、grep(內容搜尋)。
3網路與 MCP web_search 搜尋網路、web_fetch 抓取頁面。 mcp_servers[] 連接外部 MCP 伺服器以擴展工具面。
VII.

串流與操控

Streaming & Steering
SSE stream
GET /v1/sessions/{id}/stream
mid-execution steering

傳統 API 呼叫是「送出、等待、接收」的單次往返。Managed Agents 的串流架構則開啟了 一條持續的 SSE(Server-Sent Events)通道:客戶端透過 GET /v1/sessions/{id}/stream 建立連線,伺服器持續推送事件—— agent.message(文字串流)、agent.tool_use(工具呼叫)、 直到 session.status_idle 標誌任務完成。更關鍵的是,客戶端可在 agent 工作期間隨時送入新的 user.message 事件來「操控」方向——中途糾正、 補充資訊、甚至完全改變任務目標。

客戶端 Client 伺服器 Server POST /v1/sessions 建立 session + 首次 user.message GET …/stream (SSE) 建立 SSE 長連線 agent.message SSE: TEXT STREAMING CHUNKS agent.tool_use SSE: TOOL CALL (BASH, FILE, WEB…) POST …/events ↑ STEERING 中途操控:補充指令、修正方向 agent.message status_idle 任務完成 · Session Idle TIME → FULL DUPLEX: SERVER STREAMS EVENTS, CLIENT STEERS MID-FLIGHT
Why SSE? 為何選 SSE

SSE 是 HTTP 原生的單向推送協議,相較 WebSocket 更易穿透防火牆與負載均衡器。 Managed Agents 透過 SSE 下行推送事件,再以普通 POST 上行接收 steering 指令—— 這種「半雙工 + REST 補充」的設計,兼顧了即時性與簡單性。

Steering 操控模式

傳統對話必須等 agent 回覆後才能送出下一輪訊息。Steering 打破了這個限制—— agent 正在執行 bash 命令時,你可以送入「改用 Python 而非 Go」, agent 會在下一個決策點讀取並調整行為。這是真正的人機協作迴路。

VIII.

容器與持久

Containers & Persistence
container lifecycle
provision → active → persist
session survives disconnects

每個 Managed Agent session 都在一個隔離的容器中執行。容器由 environment 定義的模板 建立,預裝 Python、Node.js、Go 等常見語言執行環境。容器內的檔案在同一 session 的 多次對話間持久存在——agent 第一輪寫入的程式碼,第二輪仍可讀取和修改。更重要的是, session 本身具備持久性:即使客戶端斷線重連,agent 的狀態和容器內容都不會遺失。 透過 checkpointing 機制,系統可在需要時快照和還原容器狀態。

配置 provision 運行中 active 持久化 persist / checkpoint 重用 reuse 下一輪對話重用同一容器 容器內容 Python 3.x · Node.js · Go · Rust · git apt-get 安裝額外套件 檔案跨輪次持久 · Files persist across turns 網路模式 unrestricted — 完全開放外部存取 restricted — 僅允許白名單域名 於 environment 定義時設定 Session 持久性 斷線重連 · session 不中斷 GET /stream 重新取得事件流 container 狀態完整保留 Environment 定義容器模板 → Session 實例化容器 → 容器隨 Session 存亡
1配置 Provision 建立 session 時,系統依 environment 模板配置容器。模板定義預裝套件、 網路策略、以及初始檔案結構。
2持久化 Persist 容器內檔案系統跨輪次保留。Agent 第一輪寫的 main.py, 第三輪仍可 read 讀取、edit 修改。
3斷線恢復 Session 在客戶端斷線後仍持續存在。重新 GET /stream 即可繼續接收事件——無需重建 session 或重跑工作。
IX.

進階能力

Advanced Features — Research Preview
research preview
outcomes · multiagent
memory · request access

Managed Agents 平台提供三項研究預覽功能,目前需要申請存取權限。 Outcomes 讓你為 agent 定義明確的成功準則,系統會據此評估任務是否完成; Multiagent 支援多個 agent 之間的協調與通訊,實現任務分工; Memory 則提供跨 session 的持久記憶,讓 agent 能從歷史互動中學習。 這三項能力分別對應了 agent 系統的三大缺口——目標量化、水平擴展、長期學習。

RESEARCH PREVIEW — REQUEST ACCESS Outcomes 成果準則 定義成功條件 為 agent 設定可量化的目標 系統自動評估完成度 支援布林條件與評分函式 "tests pass" · "file exists" · "score > 0.9" Multiagent 多代理協調 Agent 間通訊 多個 agent 並行工作 任務分工與結果匯總 coordinator → worker 模式 A1 A2 A3 Memory 持久記憶 跨 Session 記憶 agent 從歷史互動中學習 偏好、模式、上下文持久化 自動摘要與知識蒸餾 session₁ → memory → session₂ → … 三項能力皆處於 Research Preview 階段 · 需申請存取權限 OUTCOMES + MULTIAGENT + MEMORY = THE NEXT FRONTIER OF AGENT SYSTEMS
Why Research Preview? 為何是研究預覽

這三項能力涉及 agent 自主性的根本提升——自我評估成果、協調同僚、跨時段學習。 Anthropic 選擇以研究預覽形式發布,一方面收集真實使用回饋,一方面逐步完善 安全護欄。申請存取可透過 Anthropic Dashboard 提交。

Implications 意涵

Outcomes 將 agent 從「盡力而為」推向「可驗證完成」;Multiagent 將單體 agent 擴展為分散式團隊;Memory 則打破了 session 間的遺忘邊界。這三者組合, 描繪出一條從工具型 AI 到自主型 AI 的演進路徑。

X.

選型與定價

Choosing & Pricing
decision matrix
tokens + $0.08/session-hr
five-layer stack

Anthropic 的 Claude 生態已形成五層堆疊:最底層是理論與原理(卷壹至肆), 之上是 Managed Agents(本卷),再上是 Messages API、Agent SDK、最頂層則是 Claude Code 本身。每一層都在下一層之上增加抽象與便利——但也增加了成本與限制。 選擇哪一層,取決於你對控制力、便利性、與成本的權衡。Managed Agents 的定價模型 為標準 token 費用加上 $0.08/session-hour 的容器運算費。 速率限制為每分鐘 60 次建立、每分鐘 600 次讀取。

五層堆疊 · Five-Layer Stack Claude Code interactive cli · max convenience Agent SDK python/ts orchestration · local control Messages API stateless · full control · byot Managed Agents hosted runtime · managed infra 理論與原理 volumes I–IV · foundations convenience ↑ control ↑ 選型準則 · When To Use What criterion msg api managed sdk / cc 代碼執行 BYOT BUILT-IN BUILT-IN 基礎設施 自行管理 HOSTED 本地/自管 狀態持久 stateless SESSION SESSION 中途操控 N/A SSE STEER interactive 自訂程度 MAXIMUM moderate limited 定價模型 · Pricing Model Token 費用 標準 Claude API 定價 · per-token + Session 費用 $0.08 / session-hour 速率限制 60 create/min 600 read/min CLI 工具:ant(Homebrew / curl / Go)· Header: managed-agents-2026-04-01
When Managed Agents? 何時選用

當你需要 agent 在雲端長時間自主工作、不想管理容器基礎設施、需要 session 持久性 與斷線恢復、且希望內建代碼執行與檔案操作時——Managed Agents 是最直接的選擇。 若你需要完全控制工具定義和執行環境,則 Messages API 更適合。 若你需要本地互動式開發,Claude Code 或 Agent SDK 更為合適。

Cost Anatomy 成本結構

$0.08/session-hour 的容器費用意味著一個持續 1 小時的 agent session 額外成本不到一杯咖啡的十分之一。真正的成本大頭仍在 token 消耗—— 長時間運行的 agent 可能產生大量工具呼叫和思考過程,累積可觀的 token 費用。 合理的 system prompt 與 outcome 定義能有效控制成本。