こんにちは、もるふぉ(@morphox_ai)です。
Claude Codeを使った「コードを書かない開発スタイル」を実践・発信しています。
2026年4月8日、AnthropicからClaude Managed Agentsがパブリックベータとしてリリースされました。
エージェント開発のあり方を根本から変えるサービスだと感じたので、エンジニア目線で整理してみます。
Claude Managed Agentsとは何か
エージェントのインフラを丸ごと任せられる新サービス
エージェントのインフラ構築、正直かなり大変ですよね。
Claude Managed Agentsは、AIエージェントの実行に必要なインフラをAnthropicが丸ごと面倒見てくれるサービスです。
エージェントを本番運用しようとすると、サンドボックス環境の構築、状態管理、権限設定、エラーハンドリング、モデルアップグレード対応......やることが山ほどあります。
自分もClaude Codeでエージェント的な開発をしていますが、これを他の人が使えるプロダクトとして提供しようとすると、インフラ周りの作業量が一気に跳ね上がります。
Claude Managed Agentsは、その部分を全部引き受けてくれます。
開発者は「エージェントに何をさせたいか」だけに集中できるわけです。
開発期間「10倍短縮」の仕組み
Anthropicの公式ブログでは「days rather than months(数ヶ月ではなく数日に)」と表現されています。
大げさに聞こえるかもしれませんが、実際にやることを考えると納得感があります。
従来のエージェント開発では以下が必要でした。
- セキュアな実行環境の構築
- ツール実行のオーケストレーション
- コンテキスト管理とプロンプトキャッシング
- エラーリカバリーの実装
- セッション永続化
これらが全部マネージドで提供されるので、開発者はエージェントの定義(モデル・プロンプト・ツール)を書くだけで本番運用に入れます。
つまり、インフラエンジニアリングの工数がほぼゼロになるんです。
では、具体的にどういう仕組みで動いているのか、コアコンセプトを見ていきましょう。
Claude Managed Agentsの4つのコアコンセプト
Agent -- モデル・プロンプト・ツールの定義
Agentは、使用するモデル(例: claude-sonnet-4-6)、システムプロンプト、利用可能なツール、MCPサーバーなどをまとめた定義です。
一度作成すればIDで参照でき、複数のセッションで使い回せます。
agent = client.beta.agents.create(
name="Coding Assistant",
model="claude-sonnet-4-6",
system="You are a helpful coding assistant.",
tools=[{"type": "agent_toolset_20260401"}],
)agent_toolset_20260401を指定すると、Bash、ファイル操作、Web検索などの組み込みツールが一括で有効になります。
Environment -- コンテナの実行環境
Environmentは、エージェントが動くコンテナのテンプレートです。
プリインストールするパッケージ(Python、Node.js、Goなど)やネットワークアクセスのルールを定義します。
environment = client.beta.environments.create(
name="quickstart-env",
config={"type": "cloud", "networking": {"type": "unrestricted"}},
)ネットワークを制限したり、特定のパッケージだけインストールしたりと、セキュリティ要件に合わせた設定が可能です。
Session -- エージェントの実行インスタンス
SessionはAgentとEnvironmentを紐づけて実際にタスクを実行するインスタンスです。
永続的なファイルシステムと会話履歴を持ち、複数回のやり取りをまたいでコンテキストが維持されます。
「前に何をやったか」を覚えたまま、長時間のタスクを継続できるのは地味に重要なポイントです。
Events -- リアルタイムなやり取り
Eventsは、アプリケーションとエージェント間でやり取りされるメッセージです。
ユーザーの入力、ツール実行結果、ステータス更新がSSE(Server-Sent Events)でリアルタイムにストリーミングされます。
実行中のエージェントに追加の指示を送って軌道修正したり、途中で中断したりすることも可能です。
これはMessages APIやAgent SDKにはない、Managed Agentsならではの強みですね。
コアコンセプトはここまでです。
「Messages APIやAgent SDKとどう違うの?」という疑問が浮かぶと思うので、次で整理します。
Messages API・Agent SDK・Managed Agentsの使い分け
3つの選択肢を一覧で比較
Claudeでエージェントを構築する方法は現在3つあります。
それぞれの特性を表にまとめました。
判断フローチャート
どれを選ぶか迷ったら、以下の流れで判断できます。
- 完全なカスタム制御が必要? → Yes → Messages API
- ローカル環境で動かしたい? → Yes → Agent SDK
- クラウドで長時間タスクを非同期実行したい? → Yes → Managed Agents
少し具体的に言うと、CI/CDパイプラインへの組み込みやユーザー向けプロダクトへのエージェント機能追加にはAgent SDKが向いています。
一方、バックグラウンドで数時間動くデータ処理やコード生成タスクを本番運用するなら、Managed Agentsの方がインフラ管理の手間を大幅に省けます。
さて、ここからはManaged Agentsの技術的に面白いポイントを深掘りしていきます。
Claude Managed Agentsの主要機能
Brain/Hands分離のセキュリティ設計
これ、初めて読んだとき「なるほど、こう解決するか」と声が出たポイントです。
Anthropicのエンジニアリングブログで解説されているアーキテクチャなのですが、Managed AgentsはBrain(脳)とHands(手)を完全に分離しています。
- Brain: Claudeモデル + ハーネス(エージェントループ、ルーティング)
- Hands: サンドボックス(コンテナ内でのコード実行、ツール実行)
従来は全コンポーネントが1つのコンテナに同居していたのを、完全に分離したんです。
この設計の何がすごいかというと、トークン隔離が実現できている点です。
APIキーやOAuthトークンなどのクレデンシャルはサンドボックスの外に保管され、プロキシ経由でアクセスします。
Claudeが生成したコードが実行される環境にはクレデンシャルが存在しないので、プロンプトインジェクション攻撃でトークンが漏洩するリスクを構造的に排除しています。
さらに、コンテナはいつでも交換可能な「Cattle(家畜)モデル」で運用されています。
コンテナが落ちてもツール呼び出しエラーとして扱い、新しいコンテナで自動リトライします。
execute(name, input) → stringというシンプルなインターフェースで、コンテナを外部ツールとして扱う設計が効いていますね。
パフォーマンス面でも、Brain/Hands分離によってp50 TTFTを約60%削減、p95では90%以上の削減を達成しています。
推論開始とコンテナプロビジョニングを並行化できるようになったためです。
永続セッションとコンテキスト管理
Managed Agentsのセッションは「コンテキストウィンドウの外で生存するコンテキストオブジェクト」として設計されています。
具体的には3層構造になっています。
- Session層: 追記のみの永続ログ。
emitEvent(id, event)で記録 - Harness層: Claudeの呼び出しとツールルーティング
- Sandbox層: 実際のコード実行
Sessionは追記のみのイベントログで、getEvents()インターフェースで柔軟にコンテキストを取得できます。
巻き戻し、スライス、前方シークが可能なので、ハーネスがクラッシュしてもwake(sessionId)で復旧できます。
エージェントが何時間動いていても、途中で問題が起きてもデータは失われない。
本番運用で一番怖い「途中でこけてやり直し」がなくなるのは、実際に使う側として非常に心強いです。
マルチエージェント・メモリ・アウトカム(研究プレビュー)
以下の3つの機能が研究プレビューとして提供されています。
- マルチエージェント: 複数のエージェントが協調してタスクを実行
- メモリ: セッションをまたいだ記憶の永続化
- アウトカム: 成功基準を定義し、エージェントが自己評価して改善
特にアウトカム機能は注目で、内部テストでは構造化ファイル生成の成功率が最大10ポイント向上したとのことです。
自己評価と改善のループが組み込まれているのは、エージェント品質の安定化に直結します。
次は、気になる料金の話です。
Claude Managed Agentsの料金と自前運用との比較
料金体系($0.08/session-hour + トークン従量課金)
Claude Managed Agentsの料金は2つの要素で構成されます。
重要なのは、アイドル時間は課金されないという点です。
ユーザーの入力待ちやツールの応答待ちなど、エージェントが実際に動いていない時間はカウントされません。
ユースケース別コスト試算
自前でエージェントインフラを構築・運用する場合と比較してみましょう。
月100時間程度のエージェント稼働なら、セッション時間のコストはわずか$8です。
自前でコンテナ基盤を組むコストやエンジニアの工数を考えると、特にスタートアップや小規模チームにとってはかなり魅力的な価格設定だと思います。
初期導入企業の活用事例
Notion・Rakuten・Asana・Sentry・Vibecodeの事例
パブリックベータ開始と同時に、すでに複数の企業が本番運用を始めています。
Notion -- ワークスペース内でカスタムエージェントを統合し、数十の並列タスクを同時実行。
チームメンバーが他の作業をしている間にエージェントがタスクを進めるスタイルです。
Rakuten -- 製品、営業、マーケティング、財務、HR部門にエージェントを展開。
1部門あたり約1週間でデプロイし、SlackやTeamsと連携してタスク指示を受け付けています。
スプレッドシートやスライド資料の作成まで自動化しているとのこと。
Asana -- プロジェクト管理ワークフロー内で「AIチームメイト」として稼働。
タスクを拾い上げて成果物のドラフトを作成し、人間と協働するスタイルです。
従来のアプローチと比べて「劇的に速く」高度な機能を追加できたと報告しています。
Sentry -- 既存のデバッグエージェント「Seer」とClaude搭載のエージェントを連携。
検出されたバグに対してパッチを自動作成し、プルリクエストを提出するフローを構築。
数ヶ月かかると見込んでいた統合が数週間で完了したそうです。
Vibecode -- プロンプトからアプリをデプロイするプラットフォーム。
Managed Agentsの導入で、同じインフラを「少なくとも10倍速く」立ち上げられるようになったとしています。
まとめ:Claude Managed Agentsを使うべき場面
Claude Managed Agentsは、エージェント開発における「インフラの壁」を取り払うサービスです。
向いている場面をまとめると以下の通りです。
- 数時間にわたる長時間タスクをクラウドで非同期実行したい
- セキュアなサンドボックス環境でコード実行させたい
- エージェントインフラの構築・運用に工数をかけたくない
- 複数のエージェントを協調させたい(研究プレビュー)
- 自社プロダクトにエージェント機能を組み込みたい
逆に、完全なカスタム制御が必要な場合やローカル環境で完結させたい場合は、Messages APIやAgent SDKの方が適しています。
CLIツール「ant」がHomebrewで提供されているので、まずはクイックスタートを試してみるのがおすすめです。
brew install anthropics/tap/ant
xattr -d com.apple.quarantine "$(brew --prefix)/bin/ant"
ant --versionAgent、Environment、Sessionを作成して最初のエージェントを動かすまで、数分で完了します。
Brain/Hands分離のアーキテクチャやセッション永続化の仕組みを実際に触ってみると、設計思想の良さが体感できるはずです。





💬 コメント
ログイン か 会員登録 するとコメントできます