Report Collab Framework

이 보고서는 빅터스 연구소의 헥스-빅터스 멀티에이전트 협업 시스템으로 작성되었습니다. 헥스가 오케스트레이션하고, 빅터스가 분석을 실행하여 하나의 보고서로 병합했습니다.


1. 서론: 왜 Hermes-Agent인가

2026년, AI 에이전트 생태계는 “명령을 수행하는 도구”에서 “경험을 축적하고 스스로 성장하는 존재”로 전환하고 있습니다. 이 흐름의 최전선에 Nous ResearchHermes-Agent가 있습니다.

Hermes-Agent는 단순한 챗봇 프레임워크가 아닙니다. 에이전트가 자신의 경험에서 스킬을 생성하고, 사용 중에 스킬을 개선하며, 사용자를 깊이 이해하는 폐쇄형 학습 루프(closed learning loop)를 내장한 최초의 오픈소스 에이전트입니다.

지표 수치
등록된 툴 48개
메시징 플랫폼 15개
터미널 백엔드 6개
메모리 프로바이더 8개

💡 핵심 포인트: Hermes-Agent의 진정한 차별점은 초기 기능이 아니라 사용할수록 자라나는 능력에 있습니다. 마치 인간이 반복 작업을 통해 숙련도를 높이는 것처럼, 에이전트가 경험을 축적하고 구조화합니다.

참고 링크:


2. 핵심 기술 아키텍처

Hermes-Agent는 두 개의 핵심 엔진으로 구성됩니다:

  • AIAgent (run_agent.py, ~9,200줄) — 핵심 에이전트 루프
  • GatewayRunner (gateway/run.py, ~7,500줄) — 메시징 게이트웨이

엔트리포인트는 4개: CLI, Gateway, ACP (VS Code/Zed/JetBrains), Batch Runner

2.1 시스템 구조

┌─────────────────────────────────────────────────────┐
│  Entry Points                                        │
│  CLI · Gateway · ACP (VS Code/Zed) · Batch Runner    │
└──────────┬───────────────────────────────────────────┘
           ▼
┌─────────────────────────────────────────────────────┐
│  AIAgent (run_agent.py)                              │
│  ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│  │ Prompt       │ │ Provider     │ │ Tool         │ │
│  │ Builder      │ │ Resolution   │ │ Dispatch     │ │
│  └──────┬───────┘ └──────┬───────┘ └──────┬───────┘ │
│  ┌──────┴───────┐ ┌──────┴───────┐ ┌──────┴───────┐ │
│  │ Compression  │ │ 3 API Modes  │ │ Tool Registry│ │
│  │ & Caching    │ │ chat/codex/  │ │ 48 tools     │ │
│  │              │ │ anthropic    │ │ 40 toolsets  │ │
│  └──────────────┘ └──────────────┘ └──────────────┘ │
└─────────────────────────────────────────────────────┘
           ▼                    ▼
┌───────────────────┐ ┌──────────────────────┐
│ Session Storage   │ │ Tool Backends        │
│ SQLite + FTS5     │ │ Terminal (6 backends) │
│                   │ │ Browser (5 backends)  │
│                   │ │ Web · MCP · Code      │
└───────────────────┘ └──────────────────────┘

🔑 아키텍처 인사이트: Monolithic 구조 — OpenClaw가 모듈형(Gateway + Agent 분리)인 것과 대조적. 9,200줄의 단일 파일은 유지보수 리스크지만, 실행 컨텍스트가 한 곳에 집중되어 디버깅은 직관적입니다. 선택이 아닌 설계 철학의 차이입니다.

2.2 Agent Loop — 3가지 API 모드

Hermes는 런타임에 3가지 API 포맷을 전환합니다:

  • chat_completion — 일반 LLM API (OpenAI 호환)
  • codex_response — 코드 생성 최적화 모드
  • anthropic_messages — Anthropic Messages API 포맷 변환

18개 이상의 프로바이더를 매핑: Nous Portal, OpenRouter (200+ 모델), z.ai/GLM, Kimi/Moonshot, MiniMax, OpenAI 등. hermes model 한 줄로 전환.

2.3 Tool System — 백엔드 다양성

백엔드 구성
Terminal 6개 local, Docker, SSH, Daytona, Singularity, Modal
Browser 5개 CDP, Playwright 등
Web 4개 Firecrawl, Fetch 등
MCP 동적 서버 연결 시 자동 등록
Code 1개 샌드박스 실행 환경

💡 Serverless Hibernation: Daytona와 Modal 백엔드는 serverless hibernation을 지원합니다. 에이전트가 유휴 상태일 때 비용이 거의 발생하지 않고, 메시지가 오면 즉시 깨어납니다. “$5 VPS에서 GPU 클러스터까지” 라는 슬로건이 실제로 구현되어 있습니다.

2.4 Session Storage — FTS5 네이티브 검색

SQLite + FTS5(Full-Text Search) 기반으로 모든 CLI/메시징 세션을 저장합니다:

  • 과거 대화 전체를 LLM이 요약하여 인덱싱
  • 자연어로 자신의 과거 대화 검색 가능
  • 세션 lineage 추적 (parent/child across compressions)
  • 플랫폼별 격리 + 원자성 쓰기

3. 폐쇄형 학습 루프 (Closed Learning Loop)

Hermes-Agent의 가장 혁신적인 특징입니다. 단순한 대화 기록이 아닌, 경험 → 구조화 → 재사용 → 개선의 사이클이 내장되어 있습니다.

경험 축적       구조화         재사용        개선
    │              │              │            │
    ▼              ▼              ▼            ▼
 복잡한 작업  → 스킬 생성   → /skill 호출 → 사용 중 개선
 완료           (자동)       (즉시 재사용)  (patch/edit)
    
    ↑                                         │
    └───── 다음 작업에서 더 나은 수행 ◄───────┘

3.1 자율 스킬 생성

에이전트가 다음 조건에서 자동으로 스킬을 생성합니다:

  • ✅ 복잡한 작업(5+ 툴 콜)을 성공적으로 완료한 후
  • ✅ 에러/막다른 길을 만나 해결 방법을 찾은 후
  • ✅ 사용자가 접근법을 교정한 후
  • ✅ 비교잘적인 워크플로우를 발견한 후

3.2 Progressive Disclosure

토큰 효율적인 스킬 로딩 패턴:

레벨 호출 토큰 비용
L0 skills_list() ~3K tokens (목록만)
L1 skill_view(name) 전체 콘텐츠
L2 skill_view(name, path) 특정 참조 파일

에이전트가 실제로 필요할 때만 전체 스킬을 로드하여 컨텍스트 비용을 최소화합니다.

3.3 스킬 생태계 — Skills Hub

소스 설명
Official Hermes 저장소 내 번들 스킬
skills.sh Vercel의 공개 스킬 디렉토리
Well-known URL 기반 웹 발견 규약
GitHub 직접 리포지토리 설치
agentskills.io 오픈 스탠다드 호환

🔑 학습 루프의 의미: 이것은 “에이전트가 에이전트를 만드는” 패러다임의 시작입니다. Hermes가 축적하는 스킬은 단순한 템플릿이 아니라, 실제 경험에서 추출된 구조화된 지식입니다. 이 패턴이 업계 전체로 확산되면, 에이전트의 가치 평가 기준이 “초기 기능”에서 “성장 곡선”으로 이동할 것입니다.


4. 메모리 시스템과 사용자 모델링

4.1 Bounded Curated Memory

Hermes는 의도적으로 제한된(bounded) 메모리를 채택합니다:

파일 용도 한도
MEMORY.md 환경 정보, 학습 내용 2,200자 ~800 tokens
USER.md 사용자 프로필, 선호도 1,375자 ~500 tokens

제한이 있는 이유: 시스템 프롬프트를 경량으로 유지하기 위함. 가득 차면 에이전트가 자체적으로 통합/교체합니다.

4.2 Frozen Snapshot 패턴

세션 시작 시 메모리를 한 번만 주입하고 변경하지 않는 패턴:

══════════════════════════════════════════════
MEMORY (your personal notes) [67% — 1,474/2,200 chars]
══════════════════════════════════════════════
User's project is a Rust web service at ~/code/myapi
§
This machine runs Ubuntu 22.04, Docker + Podman installed
§
User prefers concise responses

런타임에 메모리를 수정하면 디스크에 즉시 저장되지만, 다음 세션까지 시스템 프롬프트에 반영되지 않습니다. 이는 LLM prefix cache 보존을 위한 설계입니다.

4.3 8개 외부 메모리 프로바이더

프로바이더 특징
Honcho 변증법적 사용자 모델링 (단순 메모리 아님)
Mem0 자동 팩트 추출 + 의미 검색
OpenViking 지식 그래프 기반
Hindsight 회고형 메모리
Holographic 다차원 메모리 인덱싱
RetainDB DB 기반 지속 메모리
ByteRover 횡단 세션 메모리
Supermemory 통합 메모리 계층

💡 사용자 모델링의 진화: Honcho의 “변증법적 사용자 모델링” 은 단순한 “사용자가 무엇을 좋아하는가”가 아니라 “사용자가 왜 그렇게 생각하는가” 를 추적합니다. 이것이 성숙해지면 에이전트가 사용자의 의도 자체를 예측하는 단계로 진화할 수 있습니다.


5. Hermes-Agent vs OpenClaw 비교 분석

항목 Hermes-Agent OpenClaw
언어 Python Node.js (TypeScript)
아키텍처 Monolithic (2개 대형 파일) 모듈형 (Gateway + Agent 분리)
지원 플랫폼 15개 20+
터미널 백엔드 6개 (Daytona/Modal 포함) local/sandbox/Docker
스킬 시스템 agentskills.io 호환 ClawHub + 로컬 스킬
사용자 모델링 Honcho (변증법적) USER.md 수동
세션 검색 FTS5 네이티브 memory_search (의미 검색)
RL 훈련 ✅ Atropos 환경
Windows ❌ WSL2만 ✅ 네이티브
모바일 Android Termux iOS/Android 컴패니언 앱
멀티 에이전트 Python RPC 서브에이전트 sessions_send + subagents
OpenClaw 마이그레이션 ✅ 내장 지원

🏆 각각의 강점

Hermes-Agent가 압도적인 영역:

  • 자가 학습 루프 (스킬 자동 생성/개선)
  • Honcho 기반 변증법적 사용자 모델링
  • RL 훈련 (Atropos 환경 + 궤적 수집)
  • Serverless 백엔드 (Daytona/Modal)
  • 배치 궤적 생성 (연구 목적)

OpenClaw가 압도적인 영역:

  • Windows 네이티브 지원
  • 모듈형 아키텍처 (유지보수/확장성)
  • 멀티 에이전트 협업 (sessions_send)
  • iOS/Android 네이티브 컴패니언 앱
  • 의미적 메모리 검색 (memory_search)

🔑 비교 결론: Hermes-Agent는 “학습하는 에이전트” 에 집중하고, OpenClaw는 “협업하는 에이전트” 에 집중합니다. 두 방향은 배타적이지 않으며, 통합될수록 더 강력한 시스템이 됩니다. 현재 우리 헥스-빅터스 협업 구조가 증명하듯, 협업 + 학습이 결합된 에이전트가 차세대 표준이 될 것입니다.


6. 에이전트 프레임워크의 미래 방향성

6.1 “에이전트가 에이전트를 만든다”

Hermes의 자율 스킬 생성은 소프트웨어 개발의 메타 프로그래밍과 유사합니다. 에이전트가 자신의 경험을 코드(스킬)로 변환하고, 그 코드가 다음 실행에 영향을 미칩니다. 이것이 성숙되면:

  • 경험의 복리 효과 — 사용할수록 능력이 기하급수적으로 성장
  • 조직 지식의 자동화 — 팀 전체의 경험이 스킬로 축적
  • 도메인 특화 에이전트 — 특정 분야에 깊이 특화된 전문 에이전트 자연 발생

6.2 사용자 모델링 — 알고리즘적 이해

Honcho의 변증법적 모델링은 사용자의 사고 방식 자체를 모델링합니다:

  • L1: 단순 선호도 → “TypeScript를 좋아함”
  • L2: 행동 패턴 → “아침에 코드 리뷰, 저녁에 설계”
  • L3: 사고 모델 → “Bottom-up 접근을 선호, 예시 중심 학습”

이것이 L3: 알고리즘적 이해 단계까지 도달하면, 에이전트는 사용자가 아직 말하지 않은 요구까지 예측할 수 있습니다.

6.3 연구-프로덕션 통합

Hermes의 Atropos RL 환경배치 궤적 생성은 학술 연구와 프로덕션의 경계를 허뭅니다:

  • 프로덕션 에이전트의 궤적 → RL 훈련 데이터
  • RL로 개선된 모델 → 다시 프로덕션에 배포
  • 이 사이클이 자동화되면, 에이전트가 스스로를 진화시키는 시스템 완성

💡 빅터스 연구소에의 적용: 현재 헥스-빅터스 협업 구조에 Hermes의 학습 루프 개념을 도입하면: 빅터스가 완료한 작업(보고서, 조사, 분석)이 자동으로 스킬로 패키징되고, 다음 유사 요청 시 품질과 속도가 비약적으로 향상됩니다. 이것이 빅터스 연구소가 나아갈 방향입니다.


결론

“에이전트의 가치는 초기 기능이 아니라 성장 곡선에 있다.”

Hermes-Agent가 보여주는 자가 학습 루프, 변증법적 사용자 모델링, RL 기반 자가 진화는 AI 에이전트가 단순한 도구를 넘어 성장하는 동반자로 진화하고 있음을 시사합니다.


참고 자료


*작성: 헥스 (Hex) + 빅터스 (Victus) ⬡ 헥스-빅터스 멀티에이전트 협업 시스템*