AI経営者の参謀@ひでです。
今日は「エージェントハーネス」の話をします。
「AIエージェント、導入したいんだけど……何から手をつければいいか全然わからない」
これ、最近の経営者あるあるじゃないですか。
セミナーに行けばキラキラした事例が並んでいる。
でも自社に持ち帰ると「それで、うちは何をすればいいの?」となる。
「内製すべきか、外から買うべきか」の議論が社内でループする。
決まらないまま、また次のセミナーへ——。
僕もこの感覚、すごくよくわかるんですよ。
でも正直に言うと、この迷いの根っこには「エージェントハーネス」という概念を知らないことが多い。
ここを押さえると、霧が一気に晴れます。
「内製か外注か」じゃなくて「何をハーネスで包むか」という問いに変わる瞬間があって、それが起きると意思決定が驚くほどシンプルになるんです。
この記事では、LayerX CEO 福島良典氏のnote記事と、Google DeepMind の Philipp Schmid氏のブログをベースに、経営者が押さえるべきポイントを整理していきます。
エージェントハーネスとは何か——3分で掴む新概念
AIエージェントだけでは業務は回らない
まず大前提の話をさせてください。
「AIエージェントを導入すれば業務が自動化される」——これ、半分正解で半分間違いなんですよ。
AIエージェントは確かに賢いです。
文章を読んで、判断して、アクションを取れる。
でも、それだけで業務が回るかというと、全然回らない。
なぜかというと、業務って「判断」だけじゃなくて「管理」が必要だからです。
タスクの進捗管理、品質チェック、エラー時のリカバリー、他のシステムとの連携——こうした「判断以外のすべて」を支えるインフラが、エージェントハーネスです。
ここ、ちょっと注目してください。
ハーネスがないAIエージェントを導入するのは、「優秀な社員を採用したけど、デスクも電話もPCも与えずに『あとはよろしく』と言っている」状態なんです。
「シェフと調理場」の比喩で理解する
福島氏の比喩がとてもわかりやすいので、そのまま使わせてもらいます。
- AIエージェント = シェフ(料理の腕前=推論能力)
- エージェントハーネス = 調理場(キッチン設備、食材管理、衛生管理、オーダー管理)
どれだけ腕のいいシェフを連れてきても、包丁がない、冷蔵庫がない、オーダーが来ない調理場では料理は出せないですよね。
ハーネスが担う役割を経営者向けに整理すると、こうなります。
ここで大事なのは、ハーネスはAIではないということです。
ハーネスの多くは決定論的なコード(ルールベースのプログラム)で構成されています。
AIに「考えさせる」部分と、ルールで「管理する」部分を分けるのが、エージェントハーネスの設計思想なんですよ。
つまり、「優秀なシェフを雇うだけ」が答えではなく、「しっかりした調理場を整備することが先」——この順序を間違えると、高い採用費を払っても業務は変わらない。
なぜ今、経営者がこの概念を知る必要があるのか
Philipp Schmid氏は「2025年がエージェントの始まりの年だったとすれば、2026年はエージェントハーネスの年になる」と述べています。
AIモデルの性能は急速に上がっていて、「シェフの腕前」はどんどん良くなっている。
でも、それを業務に組み込む「調理場」の設計がボトルネックになっているのが2026年の現状です。
経営者がこの概念を理解すべき理由はシンプルで、AIへの投資判断の軸が変わるからです。
「どのAIモデルを使うか」ではなく、「どんなハーネスで包むか」が競争力の差になる時代に入っています。
で、意思決定は?——この問いに答えるための判断軸を、次のセクションから具体的に整理していきます。
ドリフト問題——経営者が見落としがちなAIの品質劣化リスク
長時間タスクでAIが「勝手に完了宣言」する
ここからは、ハーネスがなぜ必要なのかを「リスク」の観点から話します。
「うちのAI、ちゃんと動いてるな」と思っていたら、実は品質がじわじわ劣化していた——というのがドリフト問題です。
これ、意外と笑えない話なんですよ。
AIエージェントに長めのタスクを任せると、こんなことが構造的に起きます。
- 終了条件の誤認: 本当は完了していないのに、AIが「できました」と報告する
- 品質の自己過信: 自分の出力を「問題ない」と判断してしまう(セルフチェックが甘い)
- 累積的なズレ: 小さな判断ミスが積み重なって、最終的に大きく方向がずれる
人間のチームでも「報告と実態が違う」ことはありますけど、AIの場合はこれが悪意なく、モデルの特性として構造的に起きるんですよ。
ドリフトはSLAリスクとコスト増大を招く
これを経営リスクとして捉え直すと、かなり深刻です。
例えば、AIエージェントにカスタマーサポートの回答を任せているとします。
ドリフトが起きると、最初は正確だった回答が徐々にズレていく。
気づいたときには、顧客に誤った情報を大量に送ってしまっている。
これはSLA違反、顧客離脱、信頼毀損に直結します。
さらに厄介なのが、ドリフトは静かに進行すること。
エラーで止まるならすぐ気づけますが、ドリフトは「動いているけど品質が劣化している」状態なので、発見が遅れます。
「動いているから大丈夫」という油断が一番危ない。
発見が遅れた分だけ、リカバリーコストが膨らむ。
経営者としては、この「見えないリスク」をどう管理するかが問われるわけです。
ハーネスがドリフトを防ぐ仕組み
「じゃあ、どう防ぐのか?」——ここがハーネスの真骨頂です。
福島氏はドリフト対策として、ハーネスに組み込むべき仕組みを3つ挙げています。
1. 終了条件の外部化
AIに「自分で終わりかどうか判断させない」こと。
タスクの完了条件はハーネス側(ルールベースのコード)で定義して、AIの自己判断に委ねない。
2. 視覚的品質チェック
AIの出力をスクリーンショットやプレビューで確認する仕組み。
テキストだけで品質を判断させると見落とすものを、別の角度から検証する。
3. Hook(フック)
タスクの各段階でチェックポイントを設け、基準を満たさなければ先に進ませない。
人間でいう「中間報告」を仕組み化するイメージですね。
ポイントは、これらは全部AIではなくハーネス(決定論的コード)が担うということ。
AIの弱点を、AIではなくルールで補う。
この設計思想が、エージェントハーネスの核心です。
「なるほど、リスクはわかった。では自社はどの形で調理場を整えるべきか」——次のセクションでその答えを出していきます。
AI業務提供の3つの型——自社はどれを選ぶべきか
型1: AIマネージドサービス型(業務の完成品を買う)
福島氏が提唱する3つの型のうち、最初に紹介するのがAIマネージドサービス型です。
これは「ハーネス+エージェント+決定論的コード」がすべてセットになった業務の完成品を購入するモデルです。
例えるなら、レストランで完成した料理を注文するようなもの。
調理場もシェフも食材調達も、全部お店(ベンダー)側が用意してくれる。
実例でいうと、Harveyはリーガル業務の、Rampは経費管理のAIマネージドサービスを提供しています。
LayerXのバクラクも、経理業務のAIマネージドサービスとして見ることができます。
つまり、「調理場を整備する手間とコストをまるごとベンダーに委ねる」という選択です。
向いている企業: AIが本業ではない企業。
経理、法務、カスタマーサポートなど、自社の競争優位に直結しない業務をAI化したい場合。
型2: プラットフォーム/SDK+FDE型(半カスタム)
2つ目は、プラットフォームやSDKを使いつつ、ベンダーのFDE(Field Development Engineer)が自社の業務に合わせてカスタマイズしてくれるモデルです。
これは、ケータリング業者に「うちの好みに合わせたメニューを作って」と頼むイメージ。
調理場の基本設備はベンダーが持っているけど、味付けは自社仕様にできる。
向いている企業: 業務プロセスに独自性があり、汎用サービスではフィットしないが、ゼロから作るリソースはない企業。
型3: 内製型(自社エンジニアで構築)
3つ目は、ハーネスからエージェントまで全部自社で作る内製型です。
自分でキッチンを建てて、シェフを雇い、メニューも全部自分で考える。
向いている企業: AI活用そのものが競争優位の源泉である企業。
自社のデータとプロセスが独自のモートになりうる場合に限り、内製の価値がある。
3つの型を「予算×スピード×競争優位」で比較する
で、意思決定は?——ということで、3つの型を比較表で整理します。
多くのスタートアップにとっては、コア事業に直結する部分は型2か型3、それ以外は型1という組み合わせが現実的だと思っています。
「でも、今ってAIでコードも書けるんでしょ?じゃあ内製でよくない?」——この質問、めちゃくちゃよく聞かれるので次で答えます。
内製 vs マネージドサービスの経済合理性
「Claude Codeで作れるのでは?」への答え
確かに、プロトタイプを作るのは驚くほど簡単になりました。
でも、福島氏が指摘しているように、プロトタイプと本番運用の間には巨大な溝があります。
プロトタイプは「動く」ことを証明するだけ。
本番運用は「動き続ける」ことを保証しなければならない。
この差を埋めるのが、まさにハーネスの部分なんですよ。
「週末に動くものを作った」と「本番で24時間365日品質を保てる」の間には、天と地の差がある。
エンジニア人件費・機会コスト・継続改善コストの3論点
内製の経済合理性を判断するとき、見るべきコストは3つあります。
1. エンジニア人件費
ハーネスを設計・構築・運用できるエンジニアは、今のマーケットでは希少です。
現在のマーケット感覚でいえば、年収1,000万〜1,500万円クラスのエンジニアが最低2〜3名は必要になるケースが多い。
これだけで年間3,000万〜4,500万円のコストが発生します。
2. 機会コスト
そのエンジニアリソースを、本来のプロダクト開発に投下できたら?
特にスタートアップにとって、限られたエンジニアリソースをハーネス構築に割くことの機会コストは甚大です。
3. 継続改善コスト
ここが一番見落とされがちなんですけど、ハーネスは「作って終わり」じゃないんですよ。
AIモデルは数ヶ月単位でアップデートされます。
モデルが変わればハーネスも調整が必要。
業務要件も変わる。
この継続的なメンテナンスコストを、自社で永続的に負担し続けられるかどうか——マネージドサービスなら、このコストはベンダーが吸収してくれます。
福島氏のnoteを引用すると、給与計算の例がとてもわかりやすいです。
> 給与計算そのものは決定論的コード(ルール通りの計算)で行い、AIに任せるのは「異常検知」だけにする。
> アップサイドが大きく、ダウンサイドが小さい領域にだけAIを使う。
これが、AIとハーネスの役割分担の本質です。
シェフに「料理の腕前を発揮させる場面」と「レシピ通りに確実にやる場面」を分けて設計する——この発想が、内製・外注どちらを選ぶ場合でも効いてきます。
マネージドサービスが有利な条件 / 内製が有利な条件
判断をシンプルにまとめます。
マネージドサービスが有利な条件:
- その業務がコア事業ではない(経理、法務、サポート等)
- 社内にハーネスエンジニアリングの知見がない
- 6ヶ月以内に成果を出す必要がある
- AIモデルの継続的なキャッチアップにリソースを割けない
内製が有利な条件:
- AI活用そのものが事業の競争優位になる
- 自社データが独自のモートを形成している
- ハーネスエンジニアリングの知見を持つチームがいる(または採用できる)
- 長期的な投資として経営判断できる
経済合理性の話はここまでです。
「じゃあ今週、具体的に何をすればいいか」——最後のセクションで答えを出します。
経営者のアクションプラン——今週できる3つの判断
自社業務のAI化可能性をスクリーニングする
いきなり全社AI化を議論するより、まず「棚卸し」の一歩だけ踏み出すほうが圧倒的に速い。
ポイントは、業務を「判断」と「処理」に分解すること。
- 処理(ルール通りに実行する部分)→ 決定論的コード(従来のシステム)で対応
- 判断(状況に応じて考える部分)→ この中で「アップサイドが大きく、ダウンサイドが小さい」ものだけAIに任せる
福島氏のヘルプデスクエージェントの例でいうと、「ナレッジベースの自動改善」や「回答の鮮度劣化の検知」はAIに向いている領域です。
一方で「最終的な回答の送信」は人間のチェックを挟むほうが安全。
この仕分けをA4一枚でやるだけでいい。
それだけで「次に何をすべきか」が見えてきます。
マネージドサービス vs 内製の判断チェックリスト
以下のチェックリストで、各業務ごとに判断してみてください。
今週の会議に持ち込めるレベルの簡易チェックです。
- [ ] その業務は自社の競争優位に直結するか? → Yesなら内製を検討
- [ ] 社内にAIエンジニアが3名以上いるか? → Noならマネージドサービス
- [ ] 6ヶ月以内に成果が必要か? → Yesならマネージドサービス
- [ ] 業務プロセスが業界標準に近いか? → Yesならマネージドサービスがフィットしやすい
- [ ] AIモデルの進化に追従するリソースがあるか? → Noならマネージドサービス
- [ ] その業務のミスが重大な損害(法的リスク等)につながるか? → Yesならドリフト対策が整ったマネージドサービスが安全
5つ以上「マネージドサービス」に該当したら、内製にこだわる理由はほぼないと思います。
2026年に乗り遅れないための投資優先順位
最後に、投資の優先順位について。
僕が経営者として考える優先順位はこうです。
第1優先: コア事業以外の業務にAIマネージドサービスを導入する
経理、法務、カスタマーサポートなど、すでに成熟したマネージドサービスが存在する領域から着手する。
ROIが見えやすく、経営判断のハードルも低い。
第2優先: コア事業に近い領域でプラットフォーム/SDK型を試す
FDE付きのサービスを使って、自社業務に合わせたカスタマイズを検証する。
ここでハーネスの知見を社内に蓄積していく。
第3優先: 内製を検討する
型1・型2で十分な知見が溜まってから、本当に内製が必要な領域だけに絞って投資する。
いきなり型3から始めるのは、よほどの確信がない限りおすすめしません。
まとめ——エージェントハーネス時代の経営者に求められること
ここまで、エージェントハーネスの概念から、ドリフト問題、3つの型の比較、経済合理性、アクションプランまで一気に話してきました。
整理すると、経営者が押さえるべきポイントは3つです。
- AIエージェントの性能より、ハーネスの設計が業務品質を決める
- 多くの企業にとって、ハーネスは「買う」ほうが経済合理性が高い
- 内製は「競争優位に直結する領域」だけに絞る
「エージェントハーネス」という言葉自体は技術用語ですが、その本質は「AIをどう管理・運用するか」という経営課題です。
2026年、AIモデルの性能差はどんどん縮まっていきます。
差がつくのは「どう使うか」——つまりハーネスの設計とその意思決定です。
で、意思決定は?
今週中に、まず自社の業務を「判断」と「処理」に分解するところから始めてみてください。
A4一枚、30分あれば十分です。
それだけで、次の一手が見えてくるはずです。
参考文献:
- 福島良典「エージェントハーネスとAIマネージドサービス」(note)
- Philipp Schmid「The importance of Agent Harness in 2026」(philschmid.de)
- Anthropic「Building effective agents」(anthropic.com)




💬 コメント
ログイン か 会員登録 するとコメントできます