AI처럼 변화의 속도가 어마무시한 분야에는, 일종의 '성공 방정식'이 있는 것 같습니다 - 누군가 혁신적인 기준을 세우면, 다음 주자들은 그 틀을 깨기 위해 달려드는 게 바로 그 공식이구요.

최근에 AI 에이전트 영역에서도 그런 비슷한 일이 일어나고 있는 것 같은데, 그 시작점은 OpenClaw였습니다. 개인 서버에서 구동하는 AI 에이전트인데, "생각보다 훨씬 쓸 만하다"는 걸 증명하면서 커뮤니티에 등판했죠. 내가 하기 귀찮은 일을 알아서 척척 해주고, 뭘 하면 좋을지 먼저 제안도 하구요. 단순한 도구를 넘어서 '진짜 팀원' 같다는 찬사를 받으면서 단숨에 생태계를 장악했다 해도 과언이 아닙니다.

그런데, 최근에 미묘한 분위기의 변화도 감지되고 있어요. 열성적인 에이전트 전도사들 사이에서 Nous Research의 Hermes Agent로 갈아탔다는 이야기들이 조금씩 늘어나고 있거든요. 도대체 뭣 때문에 OpenClaw를 찬양하던 사람들이 Hermes Agent 쪽으로 움직이고 있는 걸까요? 그 속내를 한 번 오늘 들여다보려고 합니다.

다들 아시다시피, '메모리'를 갖춘 에이전트는 이제 흔하죠. 그렇지만 사용자와 쌓은 경험을 스스로 절차화(Proceduralize)해서 다음의 작업에 녹여내는 에이전트는, 그렇게 보기 쉽지는 않아요. 그리고 Hermes가 던지는 화두가 바로 이 지점, "단순히 시킨 일을 기억하는 수준을 넘어서, 쓰면 쓸수록 능숙해지는 에이전트라는게 가능할까?"라는 질문입니다.

이건 말처럼 쉬운 일은 아닙니다. 파편화된 경험 속에서 핵심을 포착하고, 이걸 다시 체계적으로 정리해 가면서 필요할 때 바로 꺼내 쓸 수 있는, 탄탄한 메모리 컨셉의 설계가 뒷받침되어야 하니까요.

오늘은 Hermes가 시간이 지나면서 어떻게 점점 '숙련'된 비서첱럼 성장하게끔 설계되어 있는지, 그 구조적인 모습과 메모리의 설계에 대한 내용을 중점적으로 살펴보고, OpenClaw와 비교해 보면서 두 모델의 결정적인 차이점은 무엇인지, 여러분의 상황에는 어떤 에이전트가 더 좋은 선택이 될 수 있을지 솔직하고 담백하게 이양기를 해 보겠습니다.

오늘 에피소드에서는 다음과 같은 내용을 다룹니다:

Nous Research, 어떤 곳인가

우선, 아주 간단히 Nous Research에 대해서 알아보죠.

Nous Research의 탄생 과정은 꽤 흥미롭습니다. 2022년, 디스코드와 트위터에서 자연스럽게 결성된 인터넷 기반 집단으로 시작한 팀이라고 해요. 이듬해 제프 퀘넬(Jeff Quesnelle), 카란 말호트라(Karan Malhotra), 테크니움(Teknium), 시바니 미트라(Shivani Mitra)가 공동 창업자로 나서면서 비로소 정식으로 기업의 틀을 갖추게 되었습니다. 팀의 색깔은 처음부터 명확했는데, 바로 '오픈소스'와 '탈중앙화'입니다. AI 기술이 소수 대기업에 독점되어가는 흐름에 정면으로 맞서서, 누구나 기술을 직접 소유하고 통제할 수 있는 세상을 만들겠다는 비전이었습니다.

초창기에는 헤르메스(Hermes) 모델 시리즈를 고도화하는 한편, 기술의 본질을 파고드는 근본적인 질문들을 커뮤니티에 던졌습니다. 전 세계의 소비자용 GPU를 연결해서 모델 학습 자체를 탈중앙화하려 했던 'DisTrO 프로젝트'가 대표적인 사례구요. 또 WorldSim이나 Doomscroll 같은 대규모 시뮬레이션 환경을 구축해서, 여러 에이전트가 상호작용하면서 어떤 행동 패턴을 스스로 만들어내는지 관찰하는 실험도 병행했습니다.

그러다가, 각개전투처럼 진행되든 이런 실험들이, 2024년과 2025년을 거치면서 하나의 포인트로 수렴되기 시작했다고 해요:

  • Atropos: 추론 과정을 체계적으로 학습시키기 위한 강화학습 환경

  • Forge API 및 추론 연구: 에이전트가 실행 단계에서 더 깊고 정교하게 사고할 수 있게끔 개선

  • Hermes 모델: 장기 기억 능력, 도구 활용 능력, 복잡한 추론 성능을 꾸준히 강화. 특히 2025년 공개된 Hermes 4는 하이브리드 추론과 대규모 합성 데이터 생성이라는 영역에서 혁신적인 모습을 선보임

그리고, 이 모든 기술적 자산이 집약된 결정체가 바로 Hermes Agent입니다. 이 모델이 지금 큰 주목을 받는 이유는 명확해요 - OpenClaw를 실질적으로 대체할 수 있는 '진짜' 선택지로 인식되고 있으니까요.

여기서 '진짜'라는 표현이 중요합니다. 그동안 ‘OpenClaw를 표방’한 에이전트는 많았지만, 대개 기존 아이디어를 그럴듯하게 포장한 수준에 그친 것들이었다는게 솔직한 생각입니다. 반면에, Hermes는 판을 새로 짰습니다. 에이전트의 구조 전체가 '자기 평가(Self-evaluation)'를 중심으로 작동하도록 설계한 것이 핵심이거든요.

간단히 이야기하자면, Hermes Agent는 내 컴퓨터나 서버에서 직접 구동할 수 있는 '오픈소스 자율 에이전트'입니다. 세션이 끊겨도 기억을 유지하고, 사용 경험이 쌓일수록 스스로 발전해요. 스킬을 직접 생성해서 재활용하고, 정해진 스케줄에 따라서 자율적으로 움직입니다. 하지만 그 매끈한 인터페이스 이면에는 우리가 눈으로 보는 것보다 훨씬 더 깊고 방대한 기술적 고민이 녹아 있습니다. 그걸 한 번 구경하러 가 보죠.

Hermes Agent, 어떻게 작동하나

새로운 아키텍처 살펴보기

Hermes, 설계의 철학부터 다른 에이전트들과 방향을 달리합니다.

OpenClaw가 ‘중앙의 통제 시스템’을 구축하는 데 집중했다면, Hermes는 에이전트의 '자기 개선(Self-improvement)'흐름을 최우선 순위에 두었습니다. 스스로 진화하는 에이전트가 없을까 하면서 기다려온 사용자들에게는 더할 나위 없이 반가운 방향이겠죠?

그렇지만, 본론으로 들어가기 전에, 우선은 현재 가장 널리 쓰이는 OpenClaw의 구조를 먼저 짚어보겠습니다.

OpenClaw에서 Gateway는 일종의 컨트롤 타워 역할을 합니다. 하나의 프로세스(백그라운드에서 상주하는 프로그램)가 세션 관리부터 라우팅(요청 경로 배정), 도구 실행, 상태 관리까지 모든 권한을 틀어쥐고 있는 거고, 시스템의 모든 흐름이 반드시 이 Gateway를 거쳐야만 하는 구조입니다.

반면에 Hermes는 완전히 다른 그림을 그립니다. 시스템의 중심에는 AIAgent 루프 그 자체가 자리를 잡고 있습니다. 여기서 ‘루프’라는 건, 에이전트가 "상황을 파악하고, 행동하고, 결과를 검토한 뒤 다음 단계를 결정하는" 실행 사이클을 반복하는 걸 말하구요. 나머지 구성 요소들은 이 루프를 견고하게 받쳐주는 형태로 배치되구요.

  • 게이트웨이: 외부의 요청을 받아들이는 통로

  • 크론 스케줄러(Cron Scheduler): 정해진 시간에 맞춰서 자동으로 작업을 수행하게 돕는 타이머

  • 툴링 런타임(Tooling Runtime): 에이전트가 실질적으로 도구를 조작하고 실행하는 환경

  • ACP(Agent Communication Protocol): 코드 에디터 같은 외부 프로그램이 에이전트와 표준화된 방식으로 대화할 수 있게 해주는 통신 규약 (서로 같은 언어로 소통하기 위한 일종의 '약속')

  • SQLite 기반 세션 저장소: 대화와 작업 내역을 로컬 데이터베이스에 저장해서, 프로그램을 재시작해도 이전 맥락을 잘 기억하게 해주는 장치

  • 강화학습 환경: 에이전트가 시행착오를 겪으면서 스스로 행동 방식을 교정하고 발전시킬 수 있도록 설계된 학습 구조

결론적으로, OpenClaw는 중앙 컨트롤러가 모든 것을 지휘하는 구조인 반면에, Hermes는 에이전트의 실행 루프, 즉 "실행하고 배우며 성장하는" 사이클을 핵심에 둡니다. 그리고 그 사이클이 원활하게 돌아갈 수 있도록 시스템 전체를 그 주변에 쌓아 올린 형태라고 볼 수 있습니다.

Image Credit: Hermes Agent Docs, Architecture

Hermes의 가장 큰 강점은, 특정한 앱이나 기기에 얽매이지 않는 압도적인 자유도에 있습니다. 사용자는 자신의 상황에 맞춰서 실행 환경을 폭넓게 선택할 수 있습니다.

  • 내 컴퓨터 터미널에서 즉시 실행

  • VPS(가상 사설 서버): 클라우드에서 빌린 원격 컴퓨터 활용

  • Docker: 프로그램을 독립된 가상 컨테이너에 담아서 어디서든 동일한 환경으로 구동

  • SSH: 인터넷을 통해서 원격 서버에 안전하게 접속해서 제어

  • 서버리스(Serverless): 서버를 직접 관리할 필요 없이, 필요할 때만 자원을 할당받아 실행

  • 고성능 GPU 서버: 대규모 연산이 필요한 환경까지 지원

어디서 에이전트를 돌리든, 소통 방식은 우리에게 익숙한 메신저와 하는 형태를 띕니다. Telegram, Discord, Slack, WhatsApp, Signal 같은 앱은 물론, 텍스트 명령 기반의 CLI를 통해서도 에이전트와 대화할 수 있습니다. 에이전트 본체는 고성능 원격 서버에서 돌아가더라도, 사용자는 스마트폰이나 노트북으로 가볍게 접근하면 그만입니다. 굳이 내 노트북을 하루 종일 켜둘 필요가 없는 거죠.

두뇌 역할을 하는 모델 또한 자유자재로 교체 가능합니다. OpenAI, OpenRouter, Kimi Moonshot, MiniMax, GLM, Nous Portal 같은 외부 서비스 모델을 연결하거나, 직접 구축한 API 주소를 연동할 수도 있습니다. 특히 모델을 선택하는게 코드가 아니라 '설정값'으로 처리할 수 있어서, hermes model 명령어 하나만으로 즉시 모델을 바꿀 수 있습니다. 단 한 줄의 코드도 수정할 필요 없습니다.

여기에 터미널 환경에서도 시각적인 조작이 가능한 TUI(Text User Interface) 환경까지 제공합니다. 여러 줄 입력, 명령어 자동 완성, 대화 기록 검색은 물론이고, 실행 중인 작업을 중단하거나 실시간으로 도구의 출력 결과를 확인하면서 작업의 방향을 수정할 수 있습니다. 에이전트를 다루는 경험을, 단순한 채팅을 넘어서 본격적인 전문 개발 도구를 사용하는 수준으로 진화시킨 겁니다.

하지만, 이런 편의 기능들은 Hermes를 정말 특별하게 만드는 '본질'은 아닙니다.

자기 개선과 절차적 지식: Hermes가 노하우를 쌓는 방식

Hermes의 진정한 본질은 바로 '자기 개선(Self-improvement)'에 있습니다. 작업이 마무리될 때마다 에이전트는 스스로를 복기합니다. 어떤 선택이 주효했는지, 어디서 시행착오를 겪었는지, 그리고 사용자의 수정 요청 사항은 무엇이었는지 면밀히 검토합니다. 이 반성과 회고의 과정에서 가장 핵심적인 역할을 하는 개념이 바로 '스킬(Skill)'입니다.

기존의 OpenClaw 역시 스킬을 사용하긴 합니다. 하지만 여기서의 Skill은 주로 사람이 미리 작성해 둔 도구나 워크플로우 지침을 저장했다가 필요할 때 꺼내 쓰는, 이른바 '매뉴얼' 방식에 가깝습니다.

반면에 Hermes는 접근 방식부터 다릅니다. 에이전트가 실제로 수행한 워크플로우 그 자체가 스킬이 됩니다. 복잡한 단계를 거쳐서 해결한 행동 패턴, 그것이 하나의 재사용 가능한 절차로 정립되는 겁니다. 즉, 누군가 가르쳐준 지식이 아니라 에이전트가 자신의 경험에서 직접 추출해낸 '체득된 기술'인 셈입니다.

이렇게 생성된 스킬은 아래와 같이 체계적으로 관리됩니다.

  • 지속성: 만들어진 스킬은 ~/.hermes/skills/ 폴더에 차곡차곡 저장됩니다. 세션이 종료되어도 사라지지 않고 계속 누적되며, 에이전트는 skill_manage 도구를 통해 이를 직접 다듬고 보완합니다.

  • 확장성: Skills Hub를 통해 외부의 검증된 스킬을 가져올 수도 있습니다. 이는 agentskills.io라는 오픈 표준을 따르는 다양한 저장소와 연동되어 에이전트의 능력을 무한히 확장해 줍니다.

이 모든 과정은 투명하게 공개됩니다. 에이전트는 매 단계마다 스스로 무엇을 하고 있는지 실시간으로 보여주고, 그 과정 속에서 스킬을 빌드합니다. 원리는 단순하지만 강력합니다. "많이 쓸수록 더 똑똑해진다"는 겁니다.

결국, Hermes는 단순히 "과거에 무엇을 했는지" 기억하는 수준을 넘어서, "어떻게 해야 효율적인지" 그 노하우를 스스로 축적하는 진정한 자율 지능의 단계로 올라서고자 하는 시도를 하고 있습니다.

층층이 쌓인 메모리 구조

Hermes는 메모리를 용도와 보존 기간에 따라 세 가지 계층으로 나눠서 관리합니다. 효율적인 정보 처리를 위해서 이렇게 설계를 했다고 하는데, 에이전트가 사용자의 맥락을 놓치지 않고 핵심적인 내용을 기억하게 해 줍니다.

  • 핵심 영구 메모리 (Persistent Core Memory)는 세션이 시작될 때 가장 먼저 프롬프트에 로드되는 필수 정보 계층입니다. 에이전트가 직접 기록한 노트(MEMORY.md)와 사용자의 기본 취향(USER.md)으로 구성되는데, 세션이 진행되는 동안에는 내용이 고정된 상태입니다. 세션 중에 업데이트된 메모리는 다음 세션이 시작되거나 시스템을 리빌드할 때 반영됩니다. 이 공간은 항상 최우선으로 참고되는 맥락이지만, 용량이 약 1,300 토큰 내외로 엄격히 제한되어 있습니다. 따라서 에이전트는 정말 중요한 정보만을 선별하고 압축해서 남겨야 합니다.

  • 세션 히스토리 (Session History)는 과거에 나눈 모든 대화 내역을 저장하는 방대한 기록 저장소입니다. 로컬 SQLite 데이터베이스(~/.hermes/state.db)에 저장되고, 전문 검색(FTS5) 인덱싱이 적용되어 있어서 필요한 내용을 정확하게 찾아낼 수 있습니다. 에이전트가 session_search 도구를 통해 데이터베이스에서 필요한 조각들을 찾아내면, LLM이 현재 상황에 맞춰 이를 요약하고 재구성해서 다시 추론 루프 안으로 불러들이는 방식으로 작동합니다.

  • Honcho (선택적 장기 메모리)는 세션을 넘어서 사용자를 더 깊이 이해하기 위해 추가할 수 있는 선택적 메모리 계층입니다. 단순히 과거의 대화 사실을 기억하는 게 아니라, 시간의 흐름에 따른 사용자의 선호도, 행동 패턴, 습관 등을 파악해서 장기적인 ‘사용자 모델’을 구축하는 데 초점을 맞춥니다. 이 메모리를 통해서 에이전트는 단일 세션의 파편화된 정보가 아니라, 사용자라는 사람 자체를 더 깊고 입체적으로 이해할 수 있게 됩니다.

그리고, 긴 대화가 이어져서 메모리를 압축해야 할 때, Hermes는 무턱대고 압축을 하는 게 아니라 꼭 '메모리 플러시' 단계를 거칩니다. 이것은, 사라질 수도 있는 대화 내용 중에 중요한 정보를 MEMORY.mdUSER.md에 먼저 옮겨 적는 과정으로, 핵심 정보가 압축 과정에서 유실되는 것을 막기 위한 일종의 '백업 전략'입니다.

Image Credit: Hermes Agent Docs, Persistent Memory

이 대목에서 아주 흥미로운 지점이 있는데, 바로 '스킬'을 메모리 스택의 네 번째 계층으로 이해하고 정의할 수 있다는 거예요. 이는 에이전트가 단순히 "무엇을 알고 있는가"를 넘어 "무엇을 할 줄 아는가"를 저장한다는 점에서 앞선 세 계층과는 성격이 완전히 다릅니다. 즉, 재사용 가능한 워크플로우, 다시 말해 특정 작업을 완수하는 '행동 노하우'를 담은 독립적인 층이 존재하는 셈입니다.

Hermes의 메모리 구조는 대화 기록을 단순히 쌓아두는 기존 방식과는 차원이 다릅니다. 설계의 핵심 원칙은 의외로 단순한데, 프롬프트는 최대한 가볍고 안정적으로 유지하되, 나머지는 전부 도구와 검색 시스템의 영역으로 밀어내는 것입니다.

따라서 매번 불러오는 상시 메모리에는 정말 핵심적인 정보만 담고, 그 외의 방대한 데이터는 검색 가능한 히스토리로 처리합니다. 이런 구조가 궁극적으로 추구하는 목표는 명확하죠 - 토큰 소모를 최소화하면서도, 필요한 순간에 필요한 정보를 정확하게 인출해 내는 것입니다. 덕분에 메모리는 검색과 압축이 용이한 형태로 관리되고, 추론 과정에서 필요할 때마다 선택적으로 다시 불러와서 활용할 수 있습니다.

반면에 OpenClaw는 접근 방식이 조금 다릅니다. 마크다운 파일을 기억의 핵심 기준점으로 설정하고, 그 위에 메모리 파일과 세션 기록을 동시에 색인하는 '하이브리드 검색 시스템'을 구축한 구조입니다.

OpenClaw의 구체적인 작동 방식에 대해서는 별도의 글을 통해 상세히 살펴본 적이 있으니, 궁금하신 분은 아래 링크를 참고하세요:

에이전트의 성격 만들기: 또 하나의 SOUL.md

Hermes와 OpenClaw 모두 SOUL.md라는 파일을 통해서 에이전트의 정체성을 정의하는 것은 같지만, 이 파일을 배치하는 ‘위치’를 보면, 두 서비스의 철학적 차이가 극명하게 갈린다는 걸 알 수 있어요.

우선 Hermes의 SOUL.md는 시스템 전체에 적용되는 전역(Global) 설정입니다. 어떤 프로젝트를 수행하든, 어떤 환경에서 실행하든 에이전트의 기본적인 성격은 변하지 않습니다. 에이전트의 정체성이 특정한 작업의 환경이 아니라 에이전트 본체에 귀속되어 있기 때문이예요.

반면에, OpenClaw의 SOUL.md는 워크스페이스 단위로 관리되거든요. 이 말인즉슨, 에이전트가 현재 어떤 프로젝트 폴더에서 작업하느냐에 따라 서로 다른 성격을 가질 수 있는 구조라는 겁니다. 정체성은 유지되지만, 철저히 작업 환경과 결합되어 있는 셈입니다.

결국 어느 쪽이 더 우월하다고 단정할 수는 없지만, 프로젝트의 성격에 따라 매번 다른 페르소나를 가진 에이전트가 필요하다면 OpenClaw가 효율적일 것이고, 장소나 작업의 종류에 상관없이 일관된 정체성을 유지하는 파트너를 원한다면 Hermes가 더 적합한 선택이 될 겁니다.

튜링 포스트 코리아는 독자들의 응원으로 만들어집니다. 가치있는 컨텐츠를 지속적으로 여러분과
공유할 수 있도록, 커피 한 잔으로 힘을 보태주세요 ☕

자동화: 스케줄링 지원

아마도, 많은 사람이 에이전트에게 궁극적으로 기대하는 가치 중에 빠지지 않는 것이 '자동화'겠죠. 사용자가 일일이 신경 쓰지 않아도 정해진 시간에 맞춰 스스로 업무를 처리해 주면 좋겠죠?. Hermes는 이런 자동화 기능을 설계 단계부터 시스템 내부에 깊숙이 반영했습니다.

가장 눈에 띄는 점은, 크론(Cron) 시스템이 내장되어 있어서 반복적인 업무를 자연어로 간편하게 예약할 수 있다는 것입니다. 예약된 작업들은 ~/.hermes/cron/jobs.json 파일에 저장되고, 시스템이 60초 간격으로 스케줄을 확인해서 실행 시간이 된 작업을 별도의 독립된 세션에서 처리합니다.

수행 결과는 대화창으로 직접 확인하거나 로컬 파일로 저장할 수 있고, 필요에 따라서 연결된 외부 플랫폼으로 전송할 수도 있습니다. 정기 보고서 작성, 서버 상태 점검, 단순 반복 업무처럼 주기적으로 수행해야 하는 일들을 이제 에이전트에게 완전히 믿고 맡길 수 있는 구조가 갖춰진 셈입니다.

안전은 기본

OpenClaw가 처음 공개되었을 때의 가장 뜨거운 쟁점, 모두들 아시겠지만 단연 '안전성'이었습니다. 도구 사용에 제약이 없고 자율성이 너무 높아서, 민감한 정보가 노출되거나 프롬프트 인젝션에 취약하다는 우려가 쏟아지기도 했고, 에이전트의 권한은 막강한데 이걸 제어할 기본 안전장치가 부족하다는 점이 핵심 문제로 지목됐었습니다. 물론 그 이후에 꾸준한 업데이트를 통해서 계속 개선되고 있고, 지금도 메인테이너들에 의해 보완 작업이 진행 중이긴 합니다.

반면에 Hermes는 설계 단계부터 '보안을 기본값(Security by Default)'으로 설정했습니다. 마치 성벽을 쌓듯이 다섯 겹의 방어 체계를 갖추고 있어서, 설령 한 곳이 뚫리더라도 다음 계층에서 위협을 차단하는 구조입니다.

  • 사용자 인증: 승인된 사용자만 에이전트에 접근할 수 있도록 통제

  • 위험 명령 승인: 시스템에 영향을 줄 수 있는 민감한 명령은 실행 전에 반드시 사용자의 확인을 거침

  • 컨테이너 격리: 에이전트가 운영체제 전체를 건드리지 못하도록 독립된 가상 공간(Container) 안에서만 구동

  • MCP 자격증명 필터링: 외부 도구와 통신할 때 인증 정보가 무분별하게 노출되지 않도록 거름

  • 컨텍스트 파일 스캔: 파일을 실행하기 전 위험 요소를 미리 파악하는 사전 검사

여기에 SSRF 방어(내부 서버 공격 차단), 웹사이트 블랙리스트 관리, 환경 변수 필터링, 위험 명령 스캔 기능까지 촘촘하게 더해져 있어서, 메신저나 외부 도구, 원격 서버 등 다양한 환경에서 장시간 자율적으로 돌아가는 에이전트의 특성을 고려한, 아주 실전적인 설계를 했다고 볼 수 있습니다.

내장 도구와 리서치 기능

Hermes는 로컬 에이전트 기능을 넘어서 ‘연구 인프라’로도 활용할 수 있습니다. 에이전트가 일하는 전체 과정, 즉 어떤 프롬프트를 받고 어떤 도구를 호출하고 어떤 결과를 냈는지를 모두 기록해두기 때문에, 나중에 에이전트 시스템을 개선하는 학습 데이터로 쓸 수 있습니다.

ML 엔지니어에게 유용한 도구들도 기본으로 포함되어 있어서, 모델을 직접 실험하고 개선하려는 사람들에게도 좋은 환경이구요. 오픈 모델과 함께 쓰면 파인튜닝 환경으로 발전시킬 수도 있지만, 기록된 데이터를 실제 학습에 바로 쓰기 위해서는 별도의 가공 작업이 필요하기는 합니다.

바로 써보려면 (사용 방법)

Hermes는 사용자들의 진입 장벽을 최대한 낮췄습니다. 설치는 명령어 하나로 끝나고, 이후 모든 설정은 CLI 하나로 통합 관리합니다.

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

명령어 단 하나면 충분합니다. 깃허브(GitHub)에서 코드를 내려받는 것부터 시작해 파이썬(Python)과 노드(Node) 패키지 설치, 가상 환경 구성, 그리고 Hermes CLI 등록까지 모든 과정이 자동으로 처리됩니다.

사용자가 미리 준비해야 할 것은 Git뿐입니다. Hermes가 깃허브를 통해 배포되기 때문에 코드를 가져오려면 Git이 반드시 필요합니다. 단, 윈도우(Windows) 사용자라면 한 가지 체크할 점이 있는데, Hermes는 네이티브 윈도우 환경을 지원하지 않기 때문에 윈도우 위에서 리눅스 환경을 완벽하게 구현해 주는 WSL2를 먼저 설치해야 합니다.

설치가 완료된 후에 터미널을 재시작하고 hermes를 입력하면, 그 즉시 에이전트와 대화를 시작할 수 있습니다. 수동 설치 방식도 지원하지만, 기본 설치 경로는 누구나 쉽게 시작할 수 있도록 최대한 단순하게 설계되었습니다. 명령어 한 줄이면 단 2분 만에 에이전트가 구동됩니다.

특히 인상적인 기능은 OpenClaw에서 Hermes로의 이전을 자동화해두었다는 점이예요. 설치 과정 중에 기존의 ~/.openclaw 설정이 감지되면, 파일과 설정을 통째로 마이그레이션할지 묻는 창이 뜹니다. 이때 기존의 마크다운 기반 메모리 파일은 SQLite 데이터베이스로 자동 변환되고, 공들여 쌓아온 스킬과 사용자 설정도 고스란히 넘어옵니다. 에이전트와 함께 쌓아온 소중한 기록들을 버리지 않고 그대로 이어갈 수 있는 겁니다. 완전히 다른 구조를 지향하면서도 기존 사용자를 배려하는 치밀한 전략이 이 기능 하나에 압축되어 있습니다.

Hermes vs. OpenClaw

위에도 언급했지만, Hermes와 OpenClaw 두 가지의 에이전트를 나란히 비교해 보면 흥미로운 그림이 그려집니다.

두 시스템 모두 셀프 호스팅, 메시징 인터페이스, 도구 활용, 메모리 관리, 자동화라는 동일한 기술적 영역에서 움직이는 에이전트들이지만, 각자가 무게를 두는 지점은 확연히 다릅니다. OpenClaw는 에이전트의 정체성과 행동 방식을 철저히 '파일' 중심으로 관리합니다. 덕분에 사용자는 뭐가 저장되어 있는지 언제든 투명하게 들여다볼 수 있고, 변경 이력을 추적하거나 버전 관리를 하는 것이 아주 쉬운 편입니다.

반면에 Hermes는 실행 구조 자체를 아주 정밀하게 모듈화하는 방향을 택했습니다. 프롬프트, 도구, 메모리, 인터페이스를 각각 독립된 시스템으로 분리했을 뿐만 아니라, 스케줄링부터 에디터 연동, 학습 데이터 수집에 이르기까지 에이전트가 관여하는 영역을 훨씬 넓게 확장해 나갑니다.

결정적인 차이는 '스킬''메모리'를 다루는 방식에서 나타납니다.

  • 스킬(Skills): OpenClaw의 스킬은 사람이 직접 작성하고 다듬는 모듈형 플러그인이나 지침 패키지에 가깝습니다. 하지만 Hermes의 스킬은 그 역할을 넘어서 에이전트가 실제 경험을 통해 스스로 생성해낸다는 점이 핵심입니다. 즉, 스킬 자체가 에이전트의 '자기 개선 시스템'의 일부로서 유기적으로 작동합니다.

  • 메모리(Memory): OpenClaw는 메모리를 명시적인 파일 형태로 관리하니까 사용자가 직접 편집하기 좋습니다. 반면에 Hermes의 메모리는 훨씬 다이나믹한 겁니다. 실행 중에도 실시간으로 업데이트되고, 앞서 언급한 자기 개선 흐름과 맞물려서 시스템과 함께 살아 움직이는 구조를 띱니다.

요약하자면, OpenClaw가 투명성과 통제력에 집중한 시스템이라면, Hermes는 자율성과 확장성에 모든 역량을 쏟아부은 시스템이라고 할 수 있습니다.

Image Credit: 튜링포스트

사용자 입장에서 체감하는 차이를 한 문장으로 정의하자면, OpenClaw가 "사용자의 규칙에 철저히 맞춰 움직이는 도구"라는 느낌인 반면에, Hermes는 "함께 시간을 보낼수록 사용자의 방식에 맞춰 스스로를 다듬어가는 동료"에 가깝습니다.

성능 면에서는 Hermes가 처리 속도에서 우위에 있다는 평이 많지만, 전반적인 시스템의 안정성 측면에서는 OpenClaw가 더 탄탄하다는 의견도 있습니다. 또 기술적인 배경이 없는 일반 사용자라면 초기 설정 방식에서도 큰 차이를 느낄 수 있습니다. Hermes는 바로 사용할 수 있도록 설정이 미리 구성되어 있는 편이지만, OpenClaw는 사용자가 처음부터 세부적인 사항들을 직접 설정해야 하는 구조이기 때문이예요.

생태계의 확장성 측면에서는 OpenClaw가 확실히 앞서 나가고 있습니다. NVIDIA와 OpenAI 같은 거대 기술 기업의 전폭적인 지원을 바탕으로 인프라가 아주 견고하게 구축되어 있죠. 특히 2026년 3월 22일 자로 올라온 깃허브(GitHub) 업데이트 목록만 봐도, 이들의 개발 속도가 얼마나 가파른지 실감할 수 있습니다.

Hermes Agent가 진가를 발휘하는 상황

Hermes는 단순히 모드를 전환하는 수준을 넘어서, 동일한 실행 환경 내에서 필요한 계층을 유연하게 꺼내 쓰는 방식으로 다채로운 역할을 수행할 수 있습니다. 대화형 어시스턴트부터 도구 활용 에이전트, 에디터 연동 도우미, 그리고 학습용 데이터 생성기까지, 하나의 시스템이 상황에 따라 최적화된 모습으로 변모하는 셈이예요.

구체적인 활용 사례를 살펴보면 그 확장성이 더욱 명확하게 드러납니다:

  • 개인 맞춤형 브리핑 봇: 정해진 스케줄에 따라서 리서치를 수행하고, 일일 보고서나 주간 요약, 야간 백업 결과 등을 텔레그램이나 디스코드 메시지로 전달합니다. 단순한 알림 서비스가 아니라, 24시간 쉬지 않고 돌아가는 나만의 분석가 역할을 합니다.

  • 엔지니어링/운영팀용 보안 봇: 승인된 팀원들만 접근할 수 있는 경로로 코드 리뷰, 디버깅, 셸 명령 실행 등을 안전하게 요청할 수 있습니다. 깃허브(GitHub) 활동 요약이나 서버 상태 점검 결과를 공유 채널에 자동으로 포스팅하기도 합니다.

  • MCP 기반 깃허브 관리자: 저장소와 연결해서 오픈 이슈들을 분류하고, 반복되는 버그를 찾아내어서 직접 이슈 리포트를 작성하는 등 운영 업무를 반자동화합니다.

  • 사내 시스템 및 지식 연동: 내부 DB나 API에 접속해서 매출, 청구서, 고객 활동 데이터를 요약해 줍니다. 개발 조직은 물론 운영, 재무, 백오피스 등 전 부서에서 즉각적인 업무 효율을 낼 수 있습니다. 또한 온보딩 문서나 매뉴얼을 학습해서 질문에 답하는 지식 서버 역할도 수행합니다.

  • 핸즈프리 음성 어시스턴트: CLI는 물론 텔레그램, 디스코드의 음성 채널을 통해서 실시간으로 대화하고 답변을 들을 수 있습니다.

  • 다중 서브에이전트 운용: 방대한 리서치나 복잡한 과업을 해결하기 위해서 여러 개의 독립된 서브에이전트를 동시에 띄워 작업을 분담하고 결과를 취합합니다.

  • 비전 기반 코딩 어시스턴트: 터미널 환경에서 스크린샷이나 에러 로그를 직접 이해하고, 필요한 스크립트를 생성 및 실행하면서 디버깅부터 저장소 관리까지 도맡습니다.

  • 연구 및 학습용 데이터 생성기: 배치 워크플로우를 가동해서 모델 파인튜닝이나 연구에 필요한 고품질의 실행 궤적 데이터를 생산합니다.

물론 OpenClaw로도 이와 유사한 작업들을 구현할 수는 있습니다. 결국 핵심은 어떤 패러다임을 선택하느냐, 그리고 내 업무 흐름의 중심축을 어디에 두느냐에 달려 있습니다.

Hermes는 진짜로 OpenClaw의 라이벌이 될 수 있을까

자기 발전을 통한 성장 잠재력 면에서는 Hermes가 확실히 OpenClaw보다 앞서 있다고 생각합니다.

몇 주간 꾸준히 활용하다 보면, 에이전트가 스스로 생성하고 사용자의 피드백을 거쳐서 정교해진 스킬들이 차곡차곡 쌓여 있는 모습을 발견하게 될 겁니다. 체계적으로 계층화된 메모리 구조 덕분에 이런 성장 과정을 관리하기가 훨씬 수월하다고 해요. 반면에, 시스템을 직접 통제하고 스킬 하나하나를 세밀하게 수동으로 다듬는 것을 선호한다면 OpenClaw가 더 나은 선택입니다.

정체성 측면에서도 차이가 있습니다. 어떤 환경에서든 일관되게 "나만의 메인 어시스턴트"로서 작동하길 원한다면 Hermes의 구조가 훨씬 깔끔합니다. 반대로, 에이전트의 워크스페이스를 파일과 습관, 일일 노트가 유기적으로 쌓여가는 하나의 생활 공간처럼 여긴다면 OpenClaw의 방식이 더 자연스럽게 느껴질 수 있습니다.

자동화 스케줄링을 대하는 태도도 기준이 됩니다. "정해진 시간에 작업을 완수하고 결과를 보고받는 것"이 목표라면 Hermes가 효율적이지만, "에이전트가 내 상황을 수시로 살피다가 정말 중요한 순간에만 넛지(Nudge)를 주길" 바란다면 OpenClaw의 개념이 더 적합합니다.

보안 철학 또한 각자의 개성이 뚜렷합니다. 두 시스템 모두 보안을 중시하지만 강조점은 다르거든요. Hermes는 다섯 겹의 방어 체계와 강력한 보안 기본값을 내세워, 서버에서 장시간 자율적으로 구동되는 환경을 완벽히 방어하는 데 초점을 맞췄습니다. 반면에 OpenClaw는 운영자의 통제권과 투명성을 중심에 둡니다. 이는 운영자가 도구 권한 위임에 따른 리스크를 충분히 이해하고 있다는 전제 하에, 시스템을 깊이 있게 커스터마이징하는 과정 자체를 운영의 일부로 간주하는 방식입니다.

결과적으로 Hermes가 리서치 에이전트 성격이 강한 개발자 친화적이라면, OpenClaw는 조금 더 넓은 사용자층을 포용하는 범용적인 성격을 띈다고 볼 수도 있을 것 같습니다.

지금까지의 내용을 요약하자면:

  • Hermes를 선택해야 할 때: 스킬을 축적하고, 크론 잡을 수행하고, 과거 세션을 검색하는 등 쓸수록 유능해지는 장기 실행형 AI 워커가 필요할 때.

  • OpenClaw를 선택해야 할 때: 다양한 메시징 채널 활용, 파일 기반의 정체성 관리, 그리고 에이전트가 단순히 도구로 존재하는 것이 아니라 내 디지털 생태계의 일부로 함께 살아간다는 느낌을 원할 때.

하지만, 실제로 드리고 싶은 말씀은, 굳이 하나만 고집할 필요가 없다는 겁니다. 두 에이전트를 동시에 사용해 보세요. 병렬로 실행하면서 결과물을 서로 교차해서 활용하고, 가벼운 인터페이스로 이들을 연결해 보는 것도 좋습니다. 하나의 정답에 갇히지 않고 유연하게 조합해 나가는 것, 그게 바로 에이전트가 열어갈 새로운 세상이 가진 진짜 매력이니까요.

아직 아쉬운 점들

Hermes가 혁신적인 도구라는 것은 분명하지만, 모든 문제를 해결해 주는 마법 지팡이는, 당연하게도, 아닙니다. 공식 문서에서도 솔직하게 인정하듯이, 초기 설정 단계에서 세심한 주의가 필요하고 윈도우 환경에서 네이티브로 구동되지 않는다는 제약이 있습니다. 또 사용자 승인이나 컨테이너 격리 같은 보안 조치 없이는 도구 실행에 따른 위험이 여전히 있을 뿐 아니라, 메모리 용량 또한 효율성을 위해 의도적으로 제한해서 설계되어 있습니다.

특히 Hermes의 가장 큰 특징인 '학습 루프'는, 개념적으로는 매우 강력하지만 그 자기 개선 과정이 실질적인 성과로 이어지기 위해서는 모델의 기본 성능, 연결된 도구의 완성도, 그리고 이를 뒷받침하는 안전장치가 충분히 훌륭해야 한다는 전제 조건이 따릅니다. 즉, 기초 체력이 튼튼할 때 비로소 Hermes의 진가가 발휘될 수 있다는 뜻입니다.

맺으며

반복해서 말씀드리지만, 두 에이전트를 나란히 놓고 보면 ‘지향하는 철학의 차이’가 명확히 드러납니다.

OpenClaw가 사용자의 철저한 통제 아래 명확한 규칙대로 움직이는 '정교한 도구'라면, Hermes는 쓰면 쓸수록 사용자의 업무 방식에 맞춰 스스로를 최적화해 나가는 '지능형 인프라'에 가깝습니다. 만약 파일 기반의 투명한 관리와 직접적인 제어권을 중시한다면 OpenClaw가 훌륭한 선택이 될 것이고, 에이전트가 스스로 스킬을 쌓으며 장기적으로 성장하는 모습을 기대한다면 Hermes가 정답이 될 것입니다.

특히 Hermes는 명령어 한 줄로 모든 환경 구성을 끝낼 수 있는 편의성을 갖췄을 뿐만 아니라, 기존 OpenClaw 사용자가 공들여 쌓아온 설정과 메모리를 통째로 옮겨올 수 있는 자동 마이그레이션 기능까지 제공합니다. 이건 단순한 기능 추가를 넘어서 에이전트 세계의 주도권을 가져오겠다는 전략적 의지가 엿보이는 대목이기도 하죠.

결국 핵심은 어떤 패러다임을 선택하느냐, 그리고 내 업무 흐름의 중심을 어디에 두느냐에 달려 있습니다. 하지만 굳이 하나만 고집할 필요는 없습니다. 두 시스템을 병렬로 가동해 보면서 서로의 장점을 취하고 결과물을 재활용하는 것, 그것이 에이전트 기술이 가져다줄 새로운 업무 혁신을 가장 영리하게 누리는 방법일 겁니다.

아직 완벽한 해답은 나오지 않았지만, 저도 이 두 에이전트를 자유롭게 오가면서 저만의 최적화된 업무 환경을 구축해 볼 생각입니다.

보너스 및 참고자료

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!

프리미엄 플랜으로 업그레이드하시면 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있고, 튜링 포스트 코리아의 컨텐츠 제작에 큰 도움이 됩니다. 감사합니다!

  • 주간 AI 뉴스레터

  • AI 유니콘 기업들에 대한 심층 분석 기사

  • AI 기술, 산업, 정책 전문가 인터뷰

  • AI 기술 및 산업에 대한 심층 분석 시리즈

  • 분석 기사 요청 및 튜링 포스트 코리아 기고 기회 제공

읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!

Reply

Avatar

or to participate

Keep Reading