AIエージェント、また新しいやつが出てきましたよね。
「話題になってるのはわかるけど、どれも似たような感じがして選べない」——そう感じている方、自分もそのひとりでした。
でも、Hermes Agentを調べていくと「これは設計思想が根本から違う」と思わせるポイントがいくつもあって、思わず深掘りしてしまいました。
リリースからたった2ヶ月でGitHubスター7.9万超え。
しかも開発元は大手テック企業ではなく、Discordコミュニティから生まれたNous Researchという組織です。
最近Xでもこんな投稿が話題になっていました。
「タスクをポンポン自動化しても大概のことはちゃんとこなして最後まで走る」。
これ、AIエージェントにおいて実はけっこう難しいことなんですよね。
自分もClaude Codeをメインで使っているエンジニアですが、Hermes Agentのアーキテクチャを調べていくと「なるほど、だからユーザーがこういう感想を持つのか」と腹落ちするポイントがいくつもありました。
この記事では、Hermes Agentの設計思想をシニアエンジニア視点で読み解いていきます。
「何ができるか」だけでなく「なぜそう設計されているのか」を掘り下げるので、AIエージェントの選定や自分のワークフロー設計に役立つはずです。
Hermes Agentとは何か -- 「育つエージェント」の概要
「また新しいエージェントか」と思った方、ちょっと待ってください。
Hermes Agentは、Nous Researchが開発したオープンソースのAIエージェントフレームワークです。
公式のキャッチコピーは "The agent that grows with you"(あなたと共に育つエージェント)。
ここでいう「育つ」というのはマーケティング的な表現ではなく、実際のアーキテクチャに実装された機能なんですよ。
タスクを実行するたびにスキル文書を自動生成し、永続メモリに保存し、次回以降のタスクに再利用する。
このループが組み込まれているのがHermes Agentの最大の特徴です。
つまり「使えば使うほど、そのエージェントが自分の仕事のやり方を覚えていく」ということです。
MITライセンスで公開されていて、$5/月のVPSから動かせます。
ラップトップに縛られず、TelegramやSlackから指示を出してクラウドVM上でタスクを実行する、という使い方ができるのも他のエージェントとは異なるポイントですね。
NousResearchとはどんな組織か
Nous Researchは、2022年にDiscord上でAI研究者やエンジニアが集まって自然発生的に始まったプロジェクトです。
2023年に正式法人化され、共同創業者兼CEOはJeffrey Quesnelleさん。
ニューヨークに本拠を置いています。
特筆すべきは、オープンソースのファインチューニングモデルで着実に実績を積み上げてきたことです。
HermesシリーズのモデルはHugging Faceで数千万規模でダウンロードされており、Paradigm主導のシリーズAで$50Mを調達、評価額は$1B(10億ドル)に達しています。
Discordコミュニティは8.7万人を超え、研究者・開発者・エンスージアストが活発に議論しています。
「コミュニティからプロダクトが生まれる」という流れを体現している組織ですね。
わずか2ヶ月でGitHubスター7.9万の背景
2026年2月にリリースされたHermes Agentが、4月時点で7.9万スターを超えています。
フォーク数も10,700以上。
ここが面白いところなんですが、この数字はただの「バズ」ではなく、実際にフォークして使い込んでいるユーザーが多い証拠なんですよ。
なぜここまで急成長したのか。
自分が見るに、3つの要因が重なっています。
- Nous Researchの既存コミュニティ基盤: Hermesモデルのユーザーがそのまま移行した
- 「使うほど賢くなる」という明確な差別化: 他のエージェントにないコンセプト
- $5 VPSで動く敷居の低さ: 高額なAPIプランや専用環境が不要
特に2つ目の「自己改善ループ」が刺さったのは間違いないです。
では、その設計思想を詳しく見ていきましょう。
自己改善ループの設計思想 -- Hermes Agentの核心
「使うほど賢くなる」って言葉は聞き心地がいいですよね。
でも実際にアーキテクチャを見てみると、これが本当に設計として組み込まれていて、思わず「なるほど」と声が出ました。
ここからがHermes Agentの本質です。
タスク完了からスキル文書自動生成、次回再利用の流れ
Hermes Agentには skill_manage というツールが内蔵されています。
エージェントが複雑なタスクを完了したとき、自動的にスキル文書を生成して保存します。
具体的にスキル生成がトリガーされるのは以下のケースです。
- 5回以上のツール呼び出しが必要だったタスク
- エラーを回避する手順を発見したとき
- ユーザーから修正を受けたとき(推奨アプローチの学習)
- 非自明なワークフローを発見したとき
スキルは ~/.hermes/skills/ にMarkdownベースのファイルとして保存されます。
~/.hermes/skills/
├── devops/
│ └── docker-compose-debug/
│ ├── SKILL.md # メイン設定(必須)
│ ├── references/ # 追加ドキュメント
│ ├── templates/ # 出力フォーマット
│ └── scripts/ # ヘルパースクリプトこれが何を意味するかというと、「昨日Docker Composeのデバッグで30分かけて試行錯誤した手順が、今日は一発で再現される」ということです。
人間がナレッジをWikiにまとめるのと同じことを、エージェントが自動でやってくれる。
しかもそのナレッジはMarkdownだから、人間が読んで編集もできるんですよね。
なぜMarkdownで保存するのか -- agentskills.ioとの関係
「なんでMarkdownなの、DBじゃダメなの?」って思いませんでしたか。
これ、設計上とても賢い判断なんですよ。
まず、Markdownなら人間が直接読めます。
バイナリやDBに閉じ込めてしまうと、何を学習したのかブラックボックスになります。
Markdownならgit管理もできるし、チーム内で共有もしやすい。
さらに重要なのが、agentskills.ioとの互換性です。
agentskills.ioは、もともとAnthropicが提唱したエージェントスキルのオープン標準です。
フォルダ構成とマニフェストの規約を統一することで、異なるエージェント間でスキルを共有可能にしています。
Hermes Agentのスキルは、このagentskills.io標準に準拠しています。
つまり、HermesのスキルをClaude CodeやCursorでも使えるし、逆も可能です。
これはいわば「npmやpipのエージェント版」みたいなものです。
スキルのインストールもコマンド一発で完了します。
hermes skills install official/security/1password
hermes skills search kubernetes
hermes skills browseベンダーロックインを避けつつエコシステムを広げる、オープンソースらしい設計判断ですね。
永続メモリ -- FTS5リコールの仕組み
ここが地味にすごいんですよ。
Hermes Agentのメモリシステムは3層構造になっています。
3層目のSession Searchが特に面白い設計です。
すべてのセッション(CLI・メッセージング問わず)がSQLiteに保存され、FTS5(Full-Text Search 5)でインデックス化されます。
過去のセッションを丸ごとコンテキストに読み込むのではなく、FTS5で関連部分だけを検索し、LLMで要約してから現在のセッションに注入する。
これによってトークン消費を抑えつつ、必要な文脈だけを引き出せる仕組みになっています。
さらに、外部メモリプロバイダーとしてHonchoとの連携も可能です。
Honchoは「弁証法的(Dialectic)推論」でユーザーモデルを構築するライブラリで、会話からユーザーの好み・習慣・目標を推論し、セッションを跨いで深い理解を蓄積していきます。
エピソード記憶(何をいつやったか)とスキル記憶(どうやるか)を分離し、それぞれ最適な方法で保存・検索する。
この設計はデータベースの正規化に通じる発想で、エンジニアとしてはかなり納得感があります。
「使うほど賢くなる」の中身がわかってきたところで、次はインフラ面の強みを見ていきます。
アーキテクチャから見えるHermes Agentの強み
自己改善ループの設計思想を見てきましたが、インフラ面のアーキテクチャも注目に値します。
6つの実行バックエンド -- ローカルからDockerやSSHまで
Hermes Agentは6つの実行バックエンドに対応しています。
これ何が嬉しいかっていうと、「開発中はLocalで試して、本番はDockerで安全に動かし、重い処理だけModalに飛ばす」みたいな使い分けができるということです。
特にDaytonaとModalのサーバーレス対応は、コスト最適化の面で大きいですよ。
使っていないときは自動ハイバネーションし、必要なときだけウェイクアップする。
$5/月のVPSでも十分動くという公式の主張は、このあたりの設計に裏打ちされているんですね。
200以上のモデル対応 -- モデル非依存の設計
Hermes Agentは特定のLLMに依存しません。
OpenRouter経由で200以上のモデルに対応しています。
対応プロバイダーの一例を挙げると、Nous Portal、OpenRouter、OpenAI、Anthropic、xAI(Grok)、Xiaomi MiMo、Kimi/Moonshot、MiniMax、Hugging Face、カスタムエンドポイントと、主要どころはほぼ網羅されています。
モデル選択は hermes model コマンドで簡単に切り替え可能です。
「普段はコスト重視でGemini Flashを使い、複雑なタスクだけClaude Opus 4.6に切り替える」といった運用が設定ファイルの変更だけでできます。
MCP(Model Context Protocol)ネイティブサポート
MCP連携はHermes Agentの強力な拡張ポイントです。
~/.hermes/config.yaml にサーバー定義を追加するだけで、MCPツールがHermesのツールレジストリに自動登録されます。
mcp_servers:
github:
command: npx
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"
fs:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-filesystem", "/home/user/project"]さらに、ツールのフィルタリングも可能です。
mcp_servers:
github:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "***"
tools:
include: [list_issues, create_issue, update_issue, search_code]
prompts: false
resources: falsetools.include で必要なツールだけ公開できるのがポイントです。
全ツールを公開するとトークン消費が増えるので、実務ではこのフィルタリングがかなり重要になります。
Claude CodeのMCP連携と比べると、設定の柔軟性はHermes Agentの方が高い印象です。
ここのアーキテクチャの話を踏まえて、次はClaude Codeとの具体的な違いを整理していきます。
Claude Code・OpenHandsとの本質的な違い
Hermes Agentが話題になると、必ず出てくるのが「Claude CodeやOpenHandsと何が違うの?」という疑問ですよね。
わかります、自分も最初そこが一番気になりました。
ここを明確に整理しておきます。
IDE依存型 vs 自律サーバー型という軸
もっとも大きな違いは、「どこで動くか」です。
Claude Codeは「今開いているプロジェクトに対してコードを書く・修正する」という使い方に最適化されています。
一方、Hermes Agentは「サーバー上で常時稼働し、メッセージング経由でいつでも指示を受ける」というアーキテクチャです。
自分はClaude Codeをメインで使っていますが、これは「コーディング」に特化しているからこそ強いんですよね。
Hermes Agentは「コーディング以外も含む汎用タスク自動化」に強い。
土俵が違うので、どちらが優れているという話ではないんですよ。
シングルタスク支援 vs 常時稼働エージェント
Claude Codeは基本的に「1つのタスクを指示→実行→完了」のサイクルです。
Hermes Agentは常時稼働を前提としており、以下のような使い方ができます。
- cronスケジューラ内蔵: 「毎朝9時にGitHubのイシューを要約してSlackに投稿」を自然言語で定義
- 並列サブエージェント: 独立したサブエージェントを生成して並列処理
- マルチプラットフォームゲートウェイ: Telegram、Discord、Slack、WhatsApp、Signal、iMessage、WeChat、Email、SMS等、16のメッセージングプラットフォームに対応
OpenHands(旧OpenDevin)はこの中間的な存在で、Dockerサンドボックスでの実行とWebブラウザ自動化が強みです。
ただし、Hermes Agentのような自己改善ループや永続メモリは持っていません。
どちらを使うべきか -- 用途別の判断基準
結論から言うと、併用がベストです。
用途によって使い分ける基準を整理しました。
自分の場合、コーディングはClaude Code、それ以外の自動化タスクはHermes Agentという棲み分けがしっくりきます。
「AIエージェントは1つに絞らなきゃ」という発想自体が、もう古いのかもしれません。
実際にどう動くのかが気になってきたと思うので、次はセットアップ手順を見ていきましょう。
実際に動かしてみた -- Hermes Agentのインストールから設定まで
アーキテクチャの話だけだと実感が湧かないですよね。
実際のセットアップ手順を見ていきます。
インストール -- ワンライナーで完了
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bashLinux、macOS、WSL2、Android(Termux)に対応しています。
Windows環境の場合はWSL2のインストールが先に必要です。
インストール後、シェルを再読み込みしてから起動します。
source ~/.bashrc && hermes言語構成はPython 93.2%なので、Pythonが入っている環境ならまず動きます。
コマンド2本で完了する気軽さは、実際に試してみるハードルをかなり下げてくれますね。
hermes setup / hermes model 設定
初回起動時のセットアップウィザードで基本設定を完了できます。
hermes setup # 対話式の初期設定ウィザード
hermes model # LLMプロバイダー・モデルの選択
hermes tools # ツールの有効化・無効化
hermes gateway # メッセージングプラットフォームの設定hermes model でモデルを選ぶとき、OpenRouter経由なら200以上のモデルから選択できます。
コストと性能のバランスで選ぶなら、普段使いはGemini Flash系、重要タスクはClaude系やGPT系に切り替えるのが現実的です。
MCP連携の設定例
~/.hermes/config.yaml にMCPサーバーを追加します。
mcp_servers:
github:
command: npx
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_your_token_here"
git:
command: "uvx"
args: ["mcp-server-git", "--repository", "/home/user/project"]MCPサポートは標準インストールに含まれています。
npm系のMCPサーバーを使う場合は、Node.jsとnpxが必要なので事前にインストールしておいてください。
Hermesは起動時にMCPサーバーを自動検出し、そのツールを通常のツールレジストリに登録します。
追加したMCPツールは、Hermesのネイティブツールと同じように使えるので、ユーザーが意識する必要はありません。
セットアップの全体像がつかめたところで、最新バージョンで何が変わったのかも確認しておきましょう。
Hermes Agent v0.9.0(2026年4月)の注目アップデート
2026年4月13日にリリースされたv0.9.0は 「The Everywhere Release」 と名付けられています。
487コミット、269マージPR、167解決イシュー、24名のコントリビューター。
これだけの数字を見ると、「活発に開発が続いている」という安心感がありますね。
主な変更点を見ていきます。
ローカルWebダッシュボード
ブラウザベースの設定管理UIが追加されました。
設定ファイルを直接編集しなくても、ダッシュボードからスキルの閲覧・設定変更・ゲートウェイ管理ができます。
CLI操作に慣れていないチームメンバーにも使いやすくなりました。
Fast Mode
/fast コマンドで、OpenAIとAnthropicのプライオリティキューを利用できます。
GPT-5.4、Codex、Claudeの各モデルで、通常より低レイテンシでの応答が可能になります。
モバイル・メッセージング拡張
Android(Termux)でのネイティブ実行、iMessage(BlueBubbles経由)、WeChat/WeCom対応が追加されました。
対応メッセージングプラットフォームが16種類に拡大しています。
セキュリティ強化
パストラバーサル保護、シェルインジェクション対策、SSRF防御、Twilio Webhookの署名検証(SMS RCE修正)、Git引数インジェクション防止など、本格的なセキュリティ修正が入っています。
本番環境で常時稼働させるエージェントとして、このレベルのセキュリティ対策は必須ですね。
これだけ対策が入っているということは、実際に本番運用しているユーザーがそれだけ多い、ということでもあります。
新規モデルプロバイダー
xAI(Grok)とXiaomi MiMoがネイティブプロバイダーとして追加されました。
Qwen OAuthにも対応し、モデルの選択肢がさらに広がっています。
まとめ -- Hermes Agentをシニアエンジニア視点で評価する
Hermes Agentの設計思想とアーキテクチャを一通り見てきました。
最後に、シニアエンジニアとしての率直な評価をまとめます。
高く評価できる点
- 自己改善ループのアーキテクチャ: スキル生成→Markdown保存→agentskills.io互換という設計は、実用性とエコシステムの両方を考えた賢い判断です。
使えば使うほど本当に賢くなるのは、他のエージェントにない明確な強みです。
- FTS5永続メモリ: セッション全文をSQLiteにインデックス化し、LLM要約で必要な文脈だけを注入する設計は、トークン効率と精度のバランスが良い。
- 6つの実行バックエンド: ローカル開発からサーバーレスGPUまで、段階的にスケールできる柔軟性は実務で大きなメリットです。
- MCP連携の柔軟性: ツールフィルタリングまで含めた設定の自由度は、Claude Codeより一歩先を行っています。
注意すべき点
- まだv0.9.0: 安定版の1.0には達していません。
本番環境で使う場合は、バージョンアップ時の互換性に注意が必要です。
- 学習コスト: スキル設計、メモリ設定、バックエンド選択など、設定項目が多い分、最初のセットアップには時間がかかります。
- 常時稼働のコスト: $5/月のVPSで動くとはいえ、LLM APIの料金は別途かかります。
cronで定期タスクを回すと、思った以上にAPIコストが積み上がる可能性があります。
総合評価
Hermes Agentは「AIエージェントをインフラとして常時稼働させる」という、次のフェーズのツールです。
Claude Codeが「最強のペアプログラマー」だとすれば、Hermes Agentは「育てられる自動化チームメンバー」。
7.9万スターの背景には、この設計思想への共感があると思います。
AIエージェントの選定で迷っている方は、まず自分のユースケースが「コーディング特化」なのか「汎用タスク自動化」なのかを見極めてください。
後者なら、Hermes Agentは間違いなく第一候補です。
まずはワンライナーでインストールして、ローカルモードで動かすところから始めてみてください。



💬 コメント
ログイン か 会員登録 するとコメントできます