HermesエージェントにAPI経由でブログ記事を作らせてみた:環境構築から画像生成まで全工程
- 検証日:2026年5月20日
- 検証者:まいまいこ(WebエンジニアAI副業検証ブログ)
- 関連記事:AIエージェントでブログ投稿はどこまで自動化できる?
結論から言う
Hermesを使えば「X検索→記事選定→リサーチ→下書き生成→画像生成」まで一本のパイプラインで動く。ただしプロンプトは人間が考える必要があった。「Hermesに全部考えさせる」が本来の使い方で、今回はそこまで到達できなかった。それも含めて記録する。
Hermesとは
Nous Researchが2026年2月にリリースしたオープンソースの自律型AIエージェント。
- サーバー上で常駐・定期実行できる
- Telegram・Discord・Slackなど複数のメッセージプラットフォームと接続可能
- スキルファイル(SKILL.md)でタスクを定義・拡張できる
- モデルはClaude・OpenAI・Geminiなど切り替え可能
- MIT License・完全セルフホスト・データはローカルに残る
GitHub Stars:14万超(2026年5月時点)。3ヶ月でここまで伸びたのはAIエージェント界隈でも異例。
今回やりたかったこと
X API経由でAI/副業トレンドを検索
↓ Hermesが選定・リサーチ・下書き生成(Claude API)
↓ falでアイキャッチ生成 + Pillowで日本語テキスト合成
↓ Mermaidで図解生成
↓ Codexに渡してデプロイ
このパイプラインをHermesで構築する。
環境構築
使用環境
- macOS(Apple M2 Pro・メモリ16GB)
- Hermes Agent v0.14.0
インストール
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.zshrc
hermes --version

APIキー設定
~/.hermes/.env に以下を追加:
ANTHROPIC_API_KEY=sk-ant-...
XAI_API_KEY=...
FAL_API_KEY=...
GEMINI_API_KEY=...
動作確認
hermes doctor
✓ Anthropic API が出ればOK。
スキルファイルの拡張
Hermesにはデフォルトで x-buzzy-content-automation スキルが入っていた。中身を確認すると:
- xurlを使ったX検索
- FALでの画像生成
- cronジョブでの定期実行
がすでに書かれていた。これをベースに以下を追記した:
X検索 → 「検証したくなる投稿」を選定 → リサーチ → 日本語ブログ下書き生成
→ FALでアイキャッチ生成 → Geminiで図解生成 → Codex handoff形式で出力
実際に動かした
Step 1:X検索と記事選定
hermes chat -q "x-buzzy-content-automationスキルを使って、XでAI/副業関連のトレンド投稿を5件検索して、一番検証したくなる投稿を1件選んで教えて"
Hermesが選んだのは:「Claude Code 5ヶ月の失敗ケース」(@shiga_en)
選定理由として出力されたもの:
- 実際の数字(月8.3万円)がある
- 失敗パターンを具体的に言語化している
- 「やめておけばよかった自動化」という否定的な検証が含まれている
- note記事で詳細が読める
これは良い選定だった。 このブログのコンセプト(再現できたら嬉しい系)に合っている。
Step 2:リサーチ・下書き生成
同じセッションを引き継いで指示:
hermes --resume [セッションID]
# 選んだ投稿についてnote記事をリサーチして、検証ブログの下書きを日本語で生成して保存して
生成された下書きはこちら(関連記事として公開)。
品質は想定以上だった。記事の構成・主張の整理・検証可能性の判定まで含まれていた。
Step 3:アイキャッチ生成(fal)
falで生成したベース画像:
- 人物あり・ミニマルフラットイラスト
- 左:カオスな矢印 右:整理されたフロー
- テキストなし
その上からPillowで日本語テキストを合成:
from PIL import Image, ImageDraw, ImageFont
font = ImageFont.truetype("/System/Library/Fonts/ヒラギノ角ゴシック W6.ttc", 60)
draw.text((x, y), "Claude Code × 副業5ヶ月の失敗検証", font=font, fill="white")
結果:文字がpaddingなしで端まで行った。次回改善点。

Step 4:図解生成(Mermaid)
Mermaidを使って「一気自動化 vs 段階分割」のフロー図を生成:
mmdc -i diagram.mmd -o diagram.png -w 1200 -H 800
日本語フォントは問題なく出た。英語ラベル版を採用(検証記事としての記録感を残すため)。
(完璧とは…?というツッコミが生まれたのは言う間でもない)
実コスト
| ツール | コスト |
|---|---|
| Claude API(Haiku) | $1.90 |
| X API | $0.30 |
| fal | $0.10 |
| Gemini API | 確認できず(コンソールが見づらい) |
| 合計 | $2.30+ |
元ネタの「1投稿$0.2」とは条件が全然違う。今回はインストール・環境構築・試行錯誤込みの初回コスト。パイプラインが安定すれば下がる見込みだが、現時点では再現できていない。
できたこと・できなかったこと
できた
- Hermesのクリーンインストールと環境構築
- X API経由でのトレンド検索・記事選定
- リサーチ・日本語下書き生成
- falでのアイキャッチ生成
- Mermaidでの図解生成
- Pillowでの日本語テキスト合成
できなかった・次回への課題
- プロンプトを全部Hermesに考えさせること(今回は人間が考えた)
- アイキャッチのtextパディング調整
- Geminiコストの把握
- パイプライン全体のcron自動化
- 1投稿$0.2の再現
所感
Hermesは「動く」。想定以上に。ただ「勝手に回る」には、スキルファイルとSOUL.mdの作り込みが先に必要で、そこは人間のコストが要る。
「AIで完全自動化」の話と同じで、自動化の設計コストを誰が払うか、という問いに戻ってくる。
Hermesが最も力を発揮するのは「一度設計したワークフローを繰り返し実行する」フェーズ。初期設計は人間がやるしかない。
参考リンク
AI副業を現実ラインで考えたい人へ
AI副業の現実的な始め方を整理中
派手な成功談ではなく、実際に使えるAIツール・作業フロー・案件化の考え方を、 実務目線で検証しています。
AI副業カテゴリを見る