에이전트는 또 하나의 전용 SDK가 아니라 OpenAI 호환 계약, 인증을 쥔 게이트웨이, 운영자가 믿을 실패 봉투가 필요합니다. vLLM류 서버는 공용 Wi-Fi가 아니라 루프백 뒤 인프라로 두세요.

이 페이지: 왜 게이트웨이 · 역할 표 · 설치·인증·재시도 · 인용 체크 · 429·타임아웃·디스크

전용 원격 Mac에서 OpenClaw 스킬이 OpenAI 호환 HTTP만 보게 고정하는 절차입니다. Node LTS로 게이트웨이를 빌드하고 포트·경로를 문서화한 뒤 Bearer 범위를 쪼개고 상한 재시도·예산형 회로 차단을 얹으며 호출자에는 요약 실패 본문만 돌려줍니다. 함께 읽기: LiteLLM 프록시, JSON Schema·재시도, 다중 모델 비용.

라우팅 평면이 없으면

첫째 도구가 추론 URL을 직접 치면 스키마·토큰·감사가 갈라집니다.

둘째 429·503에 상한 없는 백오프는 Apple Silicon 큐를 더 막습니다.

셋째 가중치·캐시·로그가 볼륨을 조용히 채웁니다. 로테이션과 로컬 고속 디스크가 필요합니다.

게이트웨이 vs OpenAI 호환 추론

관심사 OpenClaw 게이트웨이 OpenAI 호환 서버
스킬 라우팅 매니페스트→안정 라우트, 페이로드 검증, 상관 ID 모델 한도·큐로 chat/completions 실행
인증 최소 Bearer, 사람·에이전트 범위 분리 루프백에서만 업스트림 키·mTLS, 외부 Wi-Fi 비노출
회로·예산 공급자 오류→가시 요약 HTTP·큐·GPU 메모리 힌트

설치·게이트웨이·인증·재시도·launchd

1) Node 22 LTS를 nvm/fnm으로 고정하고 lockfile로 게이트웨이 의존성을 설치해 CI와 원격 Mac이 동일 바이너리를 씁니다.

2) vLLM류 프로세스를 127.0.0.1:8000에만 바인딩하고 OPENAI_BASE_URL을 그 출처로 둡니다. max-model-len·메모리 플래그를 모델 카드에 적습니다.

3) 다른 루프백 포트에 OpenClaw 게이트웨이, 매니페스트는 읽기 전용. HTTP 클라이언트는 게이트웨이만 호출합니다.

4) 짧은 TTL Bearer를 호출·헬스 범위로 제한하고 ~/.openclaw/token 등에 chmod 400, 업스트림 키와 같은 창에 회전합니다.

5) 429·503은 최대 3회 지터 백오프, Retry-After 준수, 회로 열리면 재시도 중단. 대화형·배치 동시성 풀 분리, 연속 실패 임계 시 5분 회로.

6) 실패는 JSON 봉투로 route·provider_family·http_status·correlation_id·remediation만 반환, 원문은 제한 로그.

7) launchd plist에 ThrottleInterval·KeepAlive·stdout 경로, 재부팅 후 curl 헬스로 기동 순서 검증.

# 환경 변수 예시(라벨과 작업 디렉터리는 프로젝트에 맞게 바꿉니다) export OPENAI_BASE_URL=http://127.0.0.1:8000/v1 export OPENCLAW_GATEWAY_PORT=8787 export OPENCLAW_TOKEN_FILE=$HOME/.openclaw/token export SKILL_RETRY_MAX=3 export SKILL_RETRY_BASE_MS=250 export CIRCUIT_FAILURE_THRESHOLD=5 export CIRCUIT_COOL_DOWN_SEC=300

운영 인용 체크

  • 라우트 표 한 줄에 모델 별칭·최대 토큰·연결·읽기 타임아웃·회로 임계를 넣어 사고 시 그대로 출력.
  • 로그엔 상관 ID·라우트·큐 체류초를 남기고 응답이 비어도 필드는 유지.
  • 야간에 가중치·캐시·JSON 로그 용량을 재고 APFS 80% 넘으면 선제 알림.

OpenTelemetry GenAI 필드와 맞추면 스팬 전송이 쉽습니다. 컷오버 전 openclaw doctor와 별칭별 curl 스모크를 런북에 묶고 plist 라벨·작업 디렉터리·리슨 포트를 당직표에 적어두면 자정 복구가 절차화됩니다. 대용량 체크포인트는 피크 외 시간대·유선으로 받아 헬스를 유지하세요.

FAQ: 429·타임아웃·디스크

429 반복: 병렬 도구 줄이기, 지터 확대, 배치는 별 별칭, 테넌트 간 큐 분리.

GPU는 한가운데인데 타임아웃: 게이트웨이가 낡은 SSH 터널을 보는지 확인, 첫 토큰 지연 측정 후 읽기 타임아웃 조정, 프리필 대기열 확인.

디스크: 전용 APFS 볼륨·로그 로테이션·데모 전 오래된 체크포인트 정리.

공개: 요금·구매는 로그인 없이, 세부는 고객센터·블로그 목록.