이 페이지 문서 Hermes의 내장 도구, 도구로 그룹화. Availability는 플랫폼, 자격 및 사용 도구에 따라 다릅니다.
빠른 카운트 (현재 등록): ~70 도구 - 10 브라우저 도구 (코어) + 2 CDP-gated 브라우저 도구, 4 파일 도구, 10 RL 도구, 4 홈 보조 도구, 2 터미널 도구, 2 웹 도구, 5 Feishu 도구, 7 Spotify 도구 (묶인 spotify 플러그인에 의해 등록), 5 Yuanbao 도구, 7 Kanban 도구 (등록 된 경우 Kanban 파견자 에이전트), 2 Discord 도구, 그리고 독립 도구의 핸드 ful (memory, ..., ..., ..., text_to_speech, image_generate, vision_analyze, video_analyze, mixture_of_agents, send_message, todo, computer_use, ...
내장 도구 외에도 Hermes는 MCP 서버에서 동적 툴을로드 할 수 있습니다. MCP 도구는 접두사 mcp_<server>_ (예: mcp_github_create_issuegithub MCP 서버)와 나타났습니다. 구성을 위한 MCP 통합를 참조하세요.
| 제품 정보 | 설명 | 환경 요구 |
|---|
browser_back | 브라우저 역사의 이전 페이지로 돌아가기. 먼저 호출하려면 browser_navigate를 요구합니다. | — |
browser_click | 스냅샷(e.g., '@e5')에서 ref ID로 식별된 요소들을 클릭합니다. ref ID는 스냅샷 출력의 사각형 브래킷에 표시됩니다. 먼저 호출하려면 browser_navigate 및 browser_snapshot가 필요합니다. | — |
browser_console | 현재 페이지의 브라우저 콘솔 출력 및 JavaScript 오류를 가져옵니다. console.log/warn/error/info 메시지와 uncaught JS 예외를 반환합니다. 이 기능을 사용하여 침묵 자바 스크립트 오류, 실패 API 호출, 및 응용 프로그램 경고. 설명 | — |
browser_get_images | URL과 alt 텍스트로 현재 페이지의 모든 이미지 목록을 가져옵니다. Vision Tool을 분석하는 이미지 찾기에 유용합니다. 먼저 호출하려면 browser_navigate를 요구합니다. | — |
browser_navigate | 브라우저의 URL로 이동합니다. 세션을 초기화하고 페이지를로드합니다. 다른 브라우저 도구 전에 호출해야합니다. 간단한 정보 검색을 위해서는 web_search 또는 web_extract (빠른, 저렴)을 선호합니다. 필요한 경우 브라우저 도구 사용.. | — |
browser_press | 키보드 키를 누릅니다. 양식 (Enter), 항해 (Tab) 또는 키보드 단축키를 제출하는 데 유용합니다. 먼저 호출하려면 browser_navigate를 요구합니다. | — |
browser_scroll | 자주 묻는 질문 아래 또는 현재의 뷰포트 위에 있을 수 있는 내용을 더 알아보세요. 먼저 호출하려면 browser_navigate를 요구합니다. | — |
browser_snapshot | 현재 페이지의 접근성 트리의 텍스트 기반 스냅 샷을 가져옵니다. browser_click and browser_type에 대한 ref ID (예: @e1, @e2)와 대화 형 요소를 반환합니다. full=false (기본값): 대화 형 요소와 컴팩트 한보기. full=true: 컴파일 | — |
browser_type | 입력 필드에 입력된 입력 필드를 입력합니다. 필드를 먼저 정리하고 새로운 텍스트를 입력합니다. 먼저 호출하려면 browser_navigate 및 browser_snapshot가 필요합니다. | — |
browser_vision | 현재 페이지의 스크린 샷을 가져 와서 Vision AI로 분석하세요. 이 페이지를 시각적으로 이해해야 할 때 사용 - 특히 CAPTCHA, 시각적 검증 문제, 복잡한 레이아웃 또는 텍스트 스냅에 유용합니다.. | — |
이 두 가지 도구는 browser 툴킷에 살고 있지만 Chrome DevTools 프로토콜 엔드포인트가 세션 시작에 도달 할 때만 등록합니다. /browser connect, browser.cdp_url 구성, Browserbase 세션 또는 Camofox.
| 제품 정보 | 설명 | 환경 요구 |
|---|
browser_cdp | Chrome DevTools 프로토콜 명령을 보냅니다. 더 높은 수준의 browser_* 도구에 의해 적용되지 않는 브라우저 작업에 대한 해치. 보기 https://chromedevtools.github.io/devtools-protocol/ | CDP 엔드포인트 |
browser_dialog | 네이티브 JavaScript 대화 상자(alert / check / prompt / beforeunload)에 응답합니다. 호출 browser_snapshot 먼저 - 종료 대화 상자는 pending_dialogs 필드에 표시됩니다. 다음 호출 browser_dialog(action='accept'|'dismiss'). | CDP 엔드포인트 |
| 제품 정보 | 설명 | 환경 요구 |
|---|
clarify | clarification, 피드백, 또는 진행하기 전에 결정이 필요한 경우 사용자에게 질문을하세요. 지원 2 형태: 1.Multiple 선택 — 최대 4개의 선택을 제공합니다. 사용자는 5th 'Other' 옵션을 통해 하나의 또는 유형의 자신의 대답을 선택합니다. 2... | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
execute_code | Hermes 도구 프로그래밍을 호출 할 수있는 Python 스크립트를 실행합니다. 이 경우 사용 3+ 도구 호출 처리 로직 사이에, 필요 필터/reduce 큰 도구 출력 하기 전에 그들은 당신의 맥락을 입력, 필요 조건 분기 (.. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
cronjob | 통합된 스케줄-task 관리자. action="create", "list", "update", "pause", "resume", "run" 또는 "remove"를 사용하여 작업을 관리합니다. 1개 이상의 첨부된 스킬을 가진 스킬백 작업과 skills=를 업데이트하여 첨부된 스킬을 지원합니다. Cron은 현재 채팅 컨텍스트 없이 신선한 세션에서 실행됩니다. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
delegate_task | Spawn 하나 또는 더 많은 시약은 격리 된 컨텍스트에서 작업에 종사합니다. 각 하위 시약은 자신의 대화, 터미널 세션 및 도구입니다. 최종 요약 만 반환됩니다 -- 중간 도구 결과는 컨텍스트 창을 입력하지 않습니다. 두.. | — |
Feishu 문서 구성 지능형 리플라이 핸들러 (gateway/platforms/feishu_comment.py)에 스코프. hermes-cli 또는 일반 Feishu 채팅 어댑터에 노출되지 않습니다.
| 제품 정보 | 설명 | 환경 요구 |
|---|
feishu_doc_read | Feishu/Lark 문서 (Docx, Doc, 또는 시트)의 전체 텍스트 내용을 file_type 및 토큰으로 읽으십시오. | Feishu 앱 자격 |
Feishu 문서 구성 핸들러에 Scoped. 드라이브 파일에 읽기 / 쓰기 작업을 구동한다.
| 제품 정보 | 설명 | 환경 요구 |
|---|
feishu_drive_add_comment | Feishu/Lark 문서 또는 파일에 최고 수준의 코멘트를 추가하세요. | Feishu 앱 자격 |
feishu_drive_list_comments | Feishu/Lark 파일에 전체 문서 댓글 목록, 가장 최근의 첫 번째. | Feishu 앱 자격 |
feishu_drive_list_comment_replies | 특정 Feishu 댓글 스레드에 답글 목록 (전체 문서 또는 로컬 선택). | Feishu 앱 자격 |
feishu_drive_reply_comment | 선택 @-mention과 함께 Feishu 댓글 스레드에 대한 답변을 게시하세요. | Feishu 앱 자격 |
| 제품 정보 | 설명 | 환경 요구 |
|---|
patch | Targeted find-and-replace 파일을 편집합니다. 터미널에서 sed/awk 대신 사용하세요. 퓨지 매칭 (9개의 전략)를 사용하여 작은 whitespace/indentation 차이는 끊지 않습니다. 통합된 디프를 반환합니다. Auto-runs 문법 검사 후 편집.. | — |
read_file | 줄 번호와 질에 텍스트 파일을 읽으십시오. Cat/head/tail 대신에 이것을 사용하세요. 출력 형식: 'LINE_NUM |회사 소개 찾을 수없는 경우 유사한 파일 이름을 제안합니다. 큰 파일을 위한 상쇄 및 한계를 사용하세요. 참고: 이미지를 읽을 수 없습니다.. | — |
search_files | 파일 내용을 검색하거나 이름으로 파일을 찾을 수 있습니다. 터미널에 있는 grep/rg/find/ls 대신에 이것을 사용하세요. Ripgrep-backed, 더 빠른 보다 셸 동등. 콘텐츠 검색 (target='content'): 파일 내 Regex 검색. 출력 모드: 라인과 전체 일치.. | — |
write_file | 파일에 콘텐츠를 작성하고 기존 콘텐츠를 완전히 대체합니다. 이 대신 echo/cat Heredoc을 터미널에 사용합니다. 부모 감독을 자동으로 만듭니다. OVERWRITES 전체 파일 - 대상 편집을위한 '패치'를 사용합니다. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
ha_call_service | Home Assistant 서비스를 호출하여 장치를 제어합니다. ha_list_services를 사용하여 사용 가능한 서비스 및 각 도메인의 매개 변수를 발견하세요. | — |
ha_get_state | 모든 속성 (밝기, 색상, 온도 설정, 센서 판독 등)을 포함한 단일 홈 보조 기관의 상세한 상태를 얻으십시오. | — |
ha_list_entities | 홈 어시스턴트를 나열합니다. 도메인 (빛, 스위치, 기후, 센서, Binary_sensor, 커버, 팬 등) 또는 지역 이름 ( 거실, 부엌, 침실 등)에 의해 선택적으로 필터. | — |
ha_list_services | 장치 제어용 홈 어시스턴트 서비스(actions) 목록. 각 장치 유형과 어떤 매개 변수에 어떤 작업을 수행 할 수 있는지 보여줍니다. ha_list_entities를 통해 발견된 장치를 제어하는 방법을 알아보세요. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
computer_use | cua-driver를 통해 배경 macOS 데스크탑 컨트롤 - 스크린 샷 (SOM / 비전 / AX), 클릭 / 드래그 / 스크롤 / 유형 / 키 / 대기, list_apps, focus_app. 사용자의 커서 또는 키보드 초점을 훔치는 것은 아닙니다. 모든 도구 캡블 모델과 함께 작동합니다. macOS 전용. | cua-driver 에 $PATH (hermes tools를 통해 설치). |
**Honcho 도구 ** (honcho_profile, honcho_search, honcho_context, honcho_reasoning, honcho_conclude)는 더 이상 내장되지 않습니다. plugins/memory/honcho/의 Honcho 메모리 제공자 플러그인을 통해 사용할 수 있습니다. Memory Providers를 설치 및 사용.
| 제품 정보 | 설명 | 환경 요구 |
|---|
image_generate | FAL.ai를 사용하여 텍스트 프롬프트에서 고품질의 이미지를 생성합니다. underlying 모델은 사용자 구성 (과태: FLUX 2 Klein 의 sub-1s 발생)이고 에이전트에 의해 선정되지 않습니다. 단일 이미지 URL을 반환합니다. 그것을 사용하여 표시.. | 사이트맵 |
에이전트가 Kanban 파견자 (HERMES_KANBAN_TASK env set)에 의해 spawned 할 때만 등록하세요. 작업자가 구조화 손전등과 함께 수행 할 수 있도록, 인간의 입력 블록, 긴 ops 동안 심장 박동, 스레드에 대한 의견, (오케스트라 터) 아이 작업에 팬. 전체 워크플로우에 대한 Kanban Multi-Agent을 참조하세요.
| 제품 정보 | 설명 | 환경 요구 |
|---|
kanban_show | 이 작업자 (제, 설명, 의견, 의존성)에 할당 된 활성 Kanban 작업을 표시합니다. | HERMES_KANBAN_TASK |
kanban_complete | 구조형 핸드오프 페이로드 (results, artifacts, follow-ups)로 수행 된 현재 작업을 표시합니다. | HERMES_KANBAN_TASK |
kanban_block | 사용자에 대한 질문에 대한 현재 작업을 차단 — 파견자 일시 정지, 표면 문제, 그리고 한 번 인간의 replies. | HERMES_KANBAN_TASK |
kanban_heartbeat | 긴 실행 가동 도중 진행 심장부를 보내십시오 그래서 파견자는 노동자를 아직도 살아 있다는 것을 알고 있습니다. | HERMES_KANBAN_TASK |
kanban_comment | 상태 변경없이 작업 스레드에 대한 코멘트를 추가 - 서핑 중간 발견에 유용합니다. | HERMES_KANBAN_TASK |
kanban_create | (Orchestrator 전용) 현재 작업에서 아이 작업을 팬. | HERMES_KANBAN_TASK + 오케스트라 역할 |
kanban_link | (Orchestrator 전용) 연결 관련 작업 (blocks/blocked-by/related). | HERMES_KANBAN_TASK + 오케스트라 역할 |
| 제품 정보 | 설명 | 환경 요구 |
|---|
memory | 세션을 통해 살아남는 지속적인 기억에 대한 중요한 정보를 저장합니다. 세션 시작에서 시스템 프롬프트에 나타납니다 -- 그것은 당신이 대화 사이 사용자와 당신의 환경에 대한 것들을 기억하는 방법입니다....에 | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
send_message | 연결된 메시징 플랫폼에 메시지를 보내거나, 사용 가능한 대상 목록. IMPORTANT: 사용자가 특정 채널 또는 사람에게 보낼 때 요청할 때 (bare platform name), call send_message(action='list') FIRST 유효한 tar.. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
mixture_of_agents | 여러 Frontier LLMs가 공동으로 어려움을 겪고 있습니다. 5 API 호출 (4 참조 모델 + 1 집계기) 최대 이유 노력 - 정품 어려운 문제에 대 한 sparingly 사용. 최고의: 복잡한 수학, 고급 alg.. | OPENROUTER_API_키 |
| 제품 정보 | 설명 | 환경 요구 |
|---|
session_search | 과거의 대화의 장기 기억을 검색하세요. 이것은 recall입니다 -- 모든 과거 세션은 검색 할 수 있으며,이 도구는 무슨 일이 있었는지 요약합니다. 이 활동 언제: - 사용자 말한다 '우리는이 전에했다', 'remember when', '마지막 ti.. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
skill_manage | 기술 관리 (create, update, delete). Skills are your procedural memory — 재발급 작업 유형에 대한 재사용 가능한 접근. 새로운 스킬은 ~ /.hermes / skills /; 기존 스킬은 그들이 살고있는 곳을 수정할 수 있습니다. 액션: 생성 (전체 SKILL.m.. | — |
skill_view | Skills는 특정 작업 및 워크플로우뿐만 아니라 스크립트 및 템플릿에 대한 정보를 로딩할 수 있습니다. 기술 전체 콘텐츠를로드하거나 연결된 파일 (references, Templates, scripts)에 액세스하세요. First call 반환 SKILL.md 콘텐츠 플러스 a.. | — |
skills_list | 유효한 스킬 목록 (이름 + 묘사). Skill_view(name)을 사용하여 전체 콘텐츠를로드합니다. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
process | 배경 프로세스를 터미널(background=true)로 시작하세요. Action: 'list' (모두보기), 'poll' (체크 상태 + 새로운 출력), 'log' (Pagination로 전체 출력), 'wait' (행 또는 타임 아웃까지 블록), 'kill' (terminate), 'write' (sen.. | — |
terminal | Linux 환경에서 쉘 명령을 실행합니다. Filesystem 호출 사이에 persists. 긴 실행 서버를 위해 background=true를 설정합니다. notify_on_complete=true (background=true)를 설정하여 프로세스가 완료되면 자동 알림을 얻을 수 있습니다. cat/head/tail을 사용하지 마십시오 — read_file을 사용하세요. grep/rg/find를 사용하지 마십시오 — search_files를 사용하세요. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
todo | 현재 세션에 대한 작업 목록 관리. 3 단계 또는 사용자가 여러 작업을 제공 할 때 복잡한 작업을 사용합니다. 현재 목록을 읽는 매개 변수가 없습니다. Writing: - 생성/업데이트 항목에 'todos' 배열 제공 - merge=.. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
vision_analyze | AI Vision를 이용한 분석 이미지. 포괄적인 설명과 이미지 내용에 대한 특정 질문을 답변합니다. | — |
Opt-in 도구 (기본 hermes-cli 세트에서 로드되지 않음). --toolsets video를 통해 추가하거나 video를 toolsets: config에 포함하세요.
| 제품 정보 | 설명 | 환경 요구 |
|---|
video_analyze | URL 또는 파일 경로의 분석 비디오 콘텐츠 - 캡션, 장면 고장, 키 타임 스탬프 및 시각적 설명. | — |
| 제품 정보 | 설명 | 환경 요구 |
|---|
web_search | 웹 검색 제목, URL 및 설명과 기본으로 최대 5개의 결과를 반환합니다. 선택 limit (1-100, 기본 5)를 수락합니다. 이 쿼리는 구성 된 백엔드를 통해 전달됩니다. site:domain, filetype:pdf, intitle:word, -term, "exact phrase"와 같은 연산자는 백엔드가 지원할 때 작동할 수 있습니다. | EXA_API_KEY 또는 PARALLEL_API_KEY 또는 FIRECRAWL_API_KEY 또는 TAVILY_API_KEY |
web_extract | 웹 페이지 URL에서 콘텐츠 추출. Markdown 형식의 페이지 내용을 반환합니다. 또한 PDF URL과 함께 작동합니다. PDF 링크를 직접 전달하고 마크다운 텍스트로 변환합니다. 5000 chars의 페이지는 전체 마크 다운을 반환합니다. 더 큰 페이지는 LLM-summarized입니다. | EXA_API_KEY 또는 PARALLEL_API_KEY 또는 FIRECRAWL_API_KEY 또는 TAVILY_API_KEY |
| 제품 정보 | 설명 | 환경 요구 |
|---|
text_to_speech | 음성 오디오로 텍스트를 변환합니다. MEDIA: 플랫폼이 음성 메시지로 전달되는 경로. Telegram에서 오디오 첨부 파일로 Discord/WhatsApp에 음성 거품으로 재생합니다. CLI 모드에서 ~/voice-memos/로 저장합니다. 음성 및 제공자.. | — |
hermes-discord 플랫폼 툴렛에 등록 (게이트웨이만). 같은 봇 토큰을 메시징 어댑터로 사용합니다.
| 제품 정보 | 설명 | 환경 요구 |
|---|
discord | Discord 서버에 대한 읽기 및 참여. 액션에는 search_members, fetch_messages, send_message, react, fetch_channel, list_channels 등이 포함됩니다. | DISCORD_BOT_TOKEN |
hermes-discord 플랫폼 툴렛에 등록. Moderation 작업은 일치하는 Discord 권한을 보유하기 위해 봇이 필요합니다.
| 제품 정보 | 설명 | 환경 요구 |
|---|
discord_admin | REST API를 통해 Discord 서버 관리: 목록 guilds/channels/roles, create/edit/delete 채널, 역할 보조금 관리, 타임아웃, 킥 및 금지. | DISCORD_BOT_TOKEN + 봇 권한 |
번들 spotify 플러그인에 의해 등록. OAuth 토큰이 필요합니다. hermes spotify setup를 한번에 실행합니다.
| 제품 정보 | 설명 | 환경 요구 |
|---|
spotify_playback | Spotify 재생을 제어, 활성 재생 상태를 검사, 또는 최근 재생 트랙을 fetch. | 스포티프 OAuth |
spotify_devices | Spotify Connect 장치 또는 이동 재생을 다른 장치에 나열하세요. | 스포티프 OAuth |
spotify_queue | 사용자의 Spotify 쿼리를 검사하거나 아이템을 추가하세요. | 스포티프 OAuth |
spotify_search | 트랙, 앨범, 아티스트, 재생목록, 쇼, 또는 에피소드에 대한 Spotify 카탈로그를 검색합니다. | 스포티프 OAuth |
spotify_playlists | 목록, 검사, 생성, 업데이트 및 Spotify 재생 목록을 수정합니다. | 스포티프 OAuth |
spotify_albums | Fetch Spotify 앨범 메타데이터 또는 앨범 트랙. | 스포티프 OAuth |
spotify_library | 목록, 저장, 또는 사용자의 저장된 Spotify 궤도 또는 앨범을 제거하세요. | 스포티프 OAuth |
hermes-yuanbao 플랫폼 툴렛에서만 등록. Yuanbao는 Tencent의 채팅 앱입니다. 이 도구는 DM / 그룹 / 스티커 API를 구동합니다.
| 제품 정보 | 설명 | 환경 요구 |
|---|
yb_query_group_info | 그룹에 대한 Query 기본 정보 (응용 프로그램에서 "좋아"라고 부름): 이름, 소유자, 회원 수. | Yuanbao 자격 |
yb_query_group_members | 그룹의 Query 회원 (@-mentions에 대한, 이름을 통해 사용자를 찾는, 봇 목록). | Yuanbao 자격 |
yb_send_dm | 그룹에 있는 사용자에 개인/직접 메시지를, 선택적인 매체 파일로 보내십시오. | Yuanbao 자격 |
yb_search_sticker | 내장 Yuanbao 스티커 (TIM face) 카탈로그를 키워드로 검색하세요. | Yuanbao 자격 |
yb_send_sticker | 현재 Yuanbao 채팅에 내장 된 스티커를 보냅니다. | Yuanbao 자격 |