한 줄 요약 🧩

LLM은 글을 잘 쓰지만, 저장소를 고치고 테스트를 돌리고 실패를 설명하는 일은 하네스가 맡아야 합니다. 에이전트 하네스는 모델, 도구, 권한, 상태, 관측, 복구를 묶어 답변을 실제 산출물로 바꾸는 실행 골격입니다.

목차 · 왜 필요한가 · 결정 매트릭스 · 구축 단계 · 인용 수치 · 구매 안내

① 도구 없는 모델 코드를 설명할 수는 있어도 파일을 읽고 수정하고 테스트 결과를 다시 반영하지 못합니다.
② 권한 없는 자동화 셸과 브라우저를 무제한 열면 빠르지만, 비밀 노출·파괴적 명령·비용 폭주를 막을 경계가 사라집니다.
③ 상태 없는 대화 긴 빌드, 중단, 재개, 사용자 승인 지점을 기억하지 못하면 에이전트는 매번 처음부터 헤맵니다.

에이전트 하네스 구성 결정 매트릭스

구성 역할 실패 시 신호 원격 Mac 기준
Tool Gate 파일·셸·API 허용 목록 권한 거부·명령 차단 프로젝트별 스코프
State Store 요약·TODO·산출물 경로 재개 실패 세션별 로그 보존
Observer 명령·diff·테스트 타임라인 원인 불명 실패 빌드 로그 압축
Recovery Loop 타임아웃·재시도·승인 무한 루프 CPU·메모리 임계

실제 일을 하는 하네스 구축 6단계

  1. 업무 경계를 먼저 씁니다. 읽기 전용 저장소, 쓰기 가능한 작업 폴더, 금지 명령을 분리합니다.
  2. 도구 호출은 스키마와 허용 목록 뒤에 둡니다. 모델은 의도를 내고, 하네스가 실행 여부를 판단합니다.
  3. 작업 상태를 TODO, 최근 diff, 실패 원인, 다음 명령으로 저장해 중단 뒤에도 이어갑니다.
  4. 관측 로그는 명령 원문보다 결과·시간·종료 코드·요약을 우선 남깁니다.
  5. 복구 규칙은 자동 재시도 2회, 파괴적 명령 승인, 장시간 빌드 알림처럼 숫자로 고정합니다.
  6. LlmMac Mac mini M4에서 Xcode 빌드, 로컬 LLM, 브라우저 도구를 함께 돌려 병목을 검증합니다.

인용 가능한 운영 기준 📌

  • 도구 권한은 모델별이 아니라 프로젝트별로 묶어야 감사가 쉽습니다.
  • 타임아웃 300초를 넘는 빌드는 백그라운드 작업으로 분리하고 진행 로그를 남깁니다.
  • 동시 도구 3개부터 CPU·메모리 피크를 기록해야 비용과 안정성을 함께 볼 수 있습니다.
  • 24GB M4 노드는 코드 인덱싱, 테스트, 소형 로컬 모델을 한 세션에서 검증하기 좋은 출발점입니다.

정리: 모델을 고용하려면 하네스부터 준비하세요 🚀

에이전트 하네스는 화려한 프롬프트가 아니라 실행 안전장치입니다. 모델은 계획과 판단을 제공하고, 하네스는 권한·상태·로그·복구를 담당합니다. 이 분리가 있어야 팀은 에이전트를 코드 리뷰, 배포 점검, 회귀 테스트 같은 반복 업무에 투입할 수 있습니다.

지금 할 일: LlmMac 구매에서 Mac mini M4 노드를 열고, SSH 연결 가이드로 하네스 런타임을 올리세요. 요금을 확인한 뒤 1주일 동안 빌드·테스트·도구 호출을 기록하면, 구매할 Mac 사양과 임대 유지 구간이 선명해집니다.