2026 에이전트 하네스 해부: 실제 일을 위한 실행 구조

한 줄 요약 🧩

LLM은 글을 잘 쓰지만, 저장소를 고치고 테스트를 돌리고 실패를 설명하는 일은 하네스가 맡아야 합니다. 에이전트 하네스는 모델, 도구, 권한, 상태, 관측, 복구를 묶어 답변을 실제 산출물로 바꾸는 실행 골격입니다.

① 도구 없는 모델 코드를 설명할 수는 있어도 파일을 읽고 수정하고 테스트 결과를 다시 반영하지 못합니다.

② 권한 없는 자동화 셸과 브라우저를 무제한 열면 빠르지만, 비밀 노출·파괴적 명령·비용 폭주를 막을 경계가 사라집니다.

③ 상태 없는 대화 긴 빌드, 중단, 재개, 사용자 승인 지점을 기억하지 못하면 에이전트는 매번 처음부터 헤맵니다.

에이전트 하네스 구성 결정 매트릭스

구성	역할	실패 시 신호	원격 Mac 기준
Tool Gate	파일·셸·API 허용 목록	권한 거부·명령 차단	프로젝트별 스코프
State Store	요약·TODO·산출물 경로	재개 실패	세션별 로그 보존
Observer	명령·diff·테스트 타임라인	원인 불명 실패	빌드 로그 압축
Recovery Loop	타임아웃·재시도·승인	무한 루프	CPU·메모리 임계

인용 가능한 운영 기준 📌

에이전트 하네스는 화려한 프롬프트가 아니라 실행 안전장치입니다. 모델은 계획과 판단을 제공하고, 하네스는 권한·상태·로그·복구를 담당합니다. 이 분리가 있어야 팀은 에이전트를 코드 리뷰, 배포 점검, 회귀 테스트 같은 반복 업무에 투입할 수 있습니다.

지금 할 일: LlmMac 구매에서 Mac mini M4 노드를 열고, SSH 연결 가이드로 하네스 런타임을 올리세요. 요금을 확인한 뒤 1주일 동안 빌드·테스트·도구 호출을 기록하면, 구매할 Mac 사양과 임대 유지 구간이 선명해집니다.