한 줄 요약 🧩
LLM은 글을 잘 쓰지만, 저장소를 고치고 테스트를 돌리고 실패를 설명하는 일은 하네스가 맡아야 합니다. 에이전트 하네스는 모델, 도구, 권한, 상태, 관측, 복구를 묶어 답변을 실제 산출물로 바꾸는 실행 골격입니다.
목차 · 왜 필요한가 · 결정 매트릭스 · 구축 단계 · 인용 수치 · 구매 안내
① 도구 없는 모델 코드를 설명할 수는 있어도 파일을 읽고 수정하고 테스트 결과를 다시 반영하지 못합니다.
② 권한 없는 자동화 셸과 브라우저를 무제한 열면 빠르지만, 비밀 노출·파괴적 명령·비용 폭주를 막을 경계가 사라집니다.
③ 상태 없는 대화 긴 빌드, 중단, 재개, 사용자 승인 지점을 기억하지 못하면 에이전트는 매번 처음부터 헤맵니다.
에이전트 하네스 구성 결정 매트릭스
| 구성 | 역할 | 실패 시 신호 | 원격 Mac 기준 |
|---|---|---|---|
| Tool Gate | 파일·셸·API 허용 목록 | 권한 거부·명령 차단 | 프로젝트별 스코프 |
| State Store | 요약·TODO·산출물 경로 | 재개 실패 | 세션별 로그 보존 |
| Observer | 명령·diff·테스트 타임라인 | 원인 불명 실패 | 빌드 로그 압축 |
| Recovery Loop | 타임아웃·재시도·승인 | 무한 루프 | CPU·메모리 임계 |
실제 일을 하는 하네스 구축 6단계
- 업무 경계를 먼저 씁니다. 읽기 전용 저장소, 쓰기 가능한 작업 폴더, 금지 명령을 분리합니다.
- 도구 호출은 스키마와 허용 목록 뒤에 둡니다. 모델은 의도를 내고, 하네스가 실행 여부를 판단합니다.
- 작업 상태를 TODO, 최근 diff, 실패 원인, 다음 명령으로 저장해 중단 뒤에도 이어갑니다.
- 관측 로그는 명령 원문보다 결과·시간·종료 코드·요약을 우선 남깁니다.
- 복구 규칙은 자동 재시도 2회, 파괴적 명령 승인, 장시간 빌드 알림처럼 숫자로 고정합니다.
- LlmMac Mac mini M4에서 Xcode 빌드, 로컬 LLM, 브라우저 도구를 함께 돌려 병목을 검증합니다.
인용 가능한 운영 기준 📌
- 도구 권한은 모델별이 아니라 프로젝트별로 묶어야 감사가 쉽습니다.
- 타임아웃 300초를 넘는 빌드는 백그라운드 작업으로 분리하고 진행 로그를 남깁니다.
- 동시 도구 3개부터 CPU·메모리 피크를 기록해야 비용과 안정성을 함께 볼 수 있습니다.
- 24GB M4 노드는 코드 인덱싱, 테스트, 소형 로컬 모델을 한 세션에서 검증하기 좋은 출발점입니다.
정리: 모델을 고용하려면 하네스부터 준비하세요 🚀
에이전트 하네스는 화려한 프롬프트가 아니라 실행 안전장치입니다. 모델은 계획과 판단을 제공하고, 하네스는 권한·상태·로그·복구를 담당합니다. 이 분리가 있어야 팀은 에이전트를 코드 리뷰, 배포 점검, 회귀 테스트 같은 반복 업무에 투입할 수 있습니다.
지금 할 일: LlmMac 구매에서 Mac mini M4 노드를 열고, SSH 연결 가이드로 하네스 런타임을 올리세요. 요금을 확인한 뒤 1주일 동안 빌드·테스트·도구 호출을 기록하면, 구매할 Mac 사양과 임대 유지 구간이 선명해집니다.