기능 개요
Hermes Agent는 기본 채팅을 넘어 멀리 확장하는 다양한 기능을 포함합니다. 영구 메모리 및 파일 인식에서 브라우저 자동화 및 음성 대화에 이르기까지이 기능은 Hermes에게 강력한 자율적 보조를 만들기 위해 함께 작동합니다.
주요 특징
- Tools & Toolsets - 도구는 에이전트의 기능을 확장하는 기능입니다. 웹 검색, 터미널 실행, 파일 편집, 메모리, 위임 등 플랫폼 당 활성화 또는 비활성화 할 수있는 논리 도구로 구성됩니다.
- Skills System — On-demand 지식 문서 에이전트가 필요할 때 로드할 수 있습니다. Skills follow the Progress disclosure pattern to minimize token usage and are compatible with the agentskills.io open standard.
- Persistent Memory - 세션 전반에 걸쳐 지속되는 큐레이터 메모리. Hermes는
MEMORY.md및...를 통해 배운 환경, 프로젝트, 환경을 기억합니다. - Context Files — 헤르메스는 프로젝트 컨텍스트 파일(
.hermes.md,AGENTS.md,CLAUDE.md,SOUL.md,.cursorrules)를 자동으로 발견하고 로드합니다. - Context References — 유형
@는 파일, 폴더, git diffs, URL을 직접 주사하는 참조를 따릅니다. Hermes는 참고 인라인을 확장하고 콘텐츠를 자동으로 추가합니다. - Checkpoints - 파일 변경을 만들기 전에 작업 디렉토리를 자동으로 스냅샷,
/rollback로 다시 롤하는 안전망을 제공합니다.
회사연혁
- Scheduled Tasks (Cron) — 자연 언어 또는 크론 표현으로 자동으로 실행되는 일정 작업. 작업은 기술을 첨부하고 모든 플랫폼에 결과를 전달하고 일시 중지 / 이력서 / 편집 작업을 지원합니다.
- Subagent Delegation —
delegate_task도구는 격리된 컨텍스트, 제한 도구, 그리고 자신의 터미널 세션과 어린이 에이전트 인스턴스를 종료합니다. 평행한 workstreams를 위한 과태 (configurable)에 의하여 3개의 동시 subagents를 실행하십시오. - Code Execution —
execute_code도구는 Hermes tools programmatically, collapsing multi-stepflows into a single LLM turn via sandboxed RPC exec. - Event Hooks — 키 라이프사이클 포인트에서 커스텀 코드를 실행합니다. Gateway Hooks 핸들 로깅, 경고, 및 webhooks; 플러그인 후크 핸들 도구 상호 작용, 미터, 및 난간.
- Batch Processing - 수백 또는 수천 개의 프롬프트를 병렬로 실행하여 구조화된 ShareGPT-format trajectory data를 훈련 데이터 생성 또는 평가합니다.
미디어 & 웹
- Voice Mode - CLI 및 메시징 플랫폼의 전체 음성 상호 작용. 마이크를 사용하여 에이전트에 대해 이야기하고 말한 답변을 듣고 Discord 음성 채널에서 라이브 음성 대화가 있습니다.
- Browser Automation - 여러 백엔드를 가진 전체 브라우저 자동화: Browserbase 클라우드, 브라우저 사용 클라우드, 로컬 크롬을 통해 CDP, 또는 로컬 크롬. Navigate 웹 사이트, 양식 작성 및 정보를 추출합니다.
- Vision & Image Paste - 멀티모드 비전 지원. 클립보드에서 CLI로 이미지를 붙여넣고, 분석, 기술, 또는 비전 캡처 가능한 모델을 사용하여 작업을 요청합니다.
- Image Generation - FAL.ai를 사용하여 텍스트 프롬프트에서 이미지를 생성한다. 지원되는 Nine 모델 (FLUX 2 Klein/Pro, GPT-Image 1.5/2, Nano Banana Pro, Ideogram V3, Recraft V4 Pro, Qwen, Z-Image 터보);
hermes tools를 통해 하나를 선택하십시오. - Voice & TTS - 10개의 네이티브 공급자 옵션과 함께 모든 메시징 플랫폼에서 Text-to-speech 출력 및 음성 메시지 transcription: Edge TTS (free), ElevenLabs, OpenAI TTS, MiniMax, Mistral Voxtral, Google Gemini, xAI, NeuTTS, KittenTTS 및 Piper - 모든 로컬 TTS CLI에 대한 사용자 지정 명령 제공업체.
통합
- MCP 통합 — stdio 또는 HTTP 전송을 통해 MCP 서버에 연결. GitHub, 데이터베이스, 파일 시스템 및 기본 헤르메스 도구를 작성하지 않고 내부 API에서 외부 도구를 액세스하십시오. per-server 도구 필터링 및 샘플링 지원 포함.
- Provider Routing - AI 공급자가 요청을 처리하는 Fine-grained 컨트롤. 비용, 속도 또는 품질에 최적화, 분류, 화이트리스트, 블랙리스트, 우선순위 주문.
- Fallback Providers - 기본 모델이 시각과 압축과 같은 보조 작업에 대한 독립적 인 fallback을 포함하여 LLM 제공 업체에 자동 실패.
- Credential Pools - 동일한 공급자를 위한 여러 키의 API 호출을 분산시킵니다. 속도 한계 또는 실패에 자동 교체.
- Memory Providers - 외부 메모리 백엔드(Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover, Supermemory)에 플러그를 삽입하여 내장 메모리 시스템을 넘어 개인화합니다.
- API Server — OpenAI 호환 HTTP 엔드포인트로 Expose Hermes. OpenAI 형식을 말하는 모든 프론트엔드를 연결 — Open WebUI, LobeChat, LibreChat 등.
- IDE Integration (ACP) - VS Code, Zed 및 JetBrains와 같은 ACP 호환 편집기 내부의 Hermes를 사용합니다. 채팅, 도구 활동, 파일 diffs 및 터미널 명령은 편집기 안쪽에 렌더링합니다.
- RL Training - 보강 학습 및 모델 미세 조정을 위한 에이전트 세션에서 trajectory 데이터를 생성합니다.
주문화
- Personality & SOUL.md - 완전 맞춤 에이전트 성격.
SOUL.md는 기본 정체 파일입니다 - 시스템 프롬프트의 첫 번째 일 - 당신은 내장 또는 사용자 정의/personality세션 당 미리 설정할 수 있습니다. - Skins & Themes — CLI의 시각적 프레젠테이션을 사용자 정의: 배너 색상, 스피너 얼굴 및 동사, 응답 상자 라벨, 브랜딩 텍스트 및 도구 활동 접두사.
- Plugins - 핵심 코드를 수정하지 않고 맞춤 도구, 후크 및 통합을 추가합니다. 3개의 플러그인 유형: 일반 플러그인(tools/hooks), 메모리 공급자(cross-session knowledge), 그리고 context Engine(alternative context management). 통합된
hermes plugins대화형 UI를 통해 관리됩니다.