目录:痛点 · 矩阵 · 安装 · 网关鉴权重试 · 技能路由 · 守护进程 · 可引用 · FAQ
本文给出租用远程 Mac上可照抄顺序:锁定 Node 二十 LTS 与回环端口,OpenClaw 校验令牌后把技能映射到 OpenAI 兼容路径,侧车管 RPM 与并发熔断,钩子写结构化失败摘要。多供应方见LiteLLM 篇;重试与可观测见工具重试、可观测矩阵。购买页与定价页免登录可览。
痛点拆解
面过大。主密钥进代理环境变量,CI 与笔记本共用,吊销即全员停摆。路由糊。各技能自拼 base_url,换端口改全仓库。预算盲。无分桶半开时,单租户长上下文顶满统一内存并发,拖垮工具链。
职责矩阵
| 层 | 负责 | 失败先看 |
|---|---|---|
| OpenClaw | 最小 scope 令牌、技能到上游路径分流 | 鉴权码与网关 trace |
| vLLM | OpenAI 兼容补全与流式、KV 与批调度 | 上游 HTTP 与显存 OOM 日志 |
| 侧车或钩子 | RPM 预算、退避重试、失败摘要外送 | 限流计数与 Webhook 队列 |
安装与运行时
一nvm 或 fnm 固定 Node 二十 LTS,plist 内写死 PATH,避免 launchd 与登录 shell 不一致。二安装 OpenClaw CLI 与网关,skills 放可写沙箱根。三容器或 venv 启 vLLM,监听 127.0.0.1,权重与 HF 缓存放独立数据卷。验收:curl 假 Bearer 被网关拒;vLLM 仅回环不可外网直达。
# 示意:launchd 环境内固定 Node 与缓存目录(勿提交真实密钥)
export NVM_DIR="$HOME/.nvm"
[ -s "$NVM_DIR/nvm.sh" ] && . "$NVM_DIR/nvm.sh"
nvm use 20
export HF_HOME="/Volumes/data/hf-cache"
export VLLM_LOGGING_LEVEL=INFO网关、鉴权与重试
对外只暴露 OpenClaw,校验 Bearer 或轮换令牌并注入 X-Request-ID;OPENAI_BASE_URL 指回环 vLLM 前缀,聊天与嵌入分桶。重试:仅对连接复位、五零二、五二九等幂等安全错用有上限指数退避加 full jitter;四二九与四〇一不重试。流式单独设首包与总时长,避免超时套娃。
技能工具链路由、熔断与摘要
OpenClaw 或侧车维护技能名到上游别名表:轻量技能共用小模型,长链单独大上下文。每路由配 RPM、并发与错误率熔断,冷却后半开只放行探针。失败钩子写 JSON:技能、路由键、HTTP 状态、子码、耗时、百字内截断,不落原文;成功可采样审计。
Node 与 launchd 守护思路
LaunchAgent 或 LaunchDaemon 分载 OpenClaw 与 vLLM,设 WorkingDirectory、StandardOutPath、ThrottleInterval 防抖;探针或 SuccessfulExit 保证 vLLM 先起。日志按日切、盯磁盘;压测用专用远程节点免合盖打断。排错:curl 对比过网关与直连,再用摘要 request_id 对齐日志。
可引用信息
- 令牌环境分桶,TTL 短于值班周期。
- 摘要带配置版本与路由键,便于复盘。
- 预算命中与 OTel GenAI 跨度共租户键,财务与可靠性同切片。
FAQ
四二九持续出现?按上文分层排查网关桶、侧车预算与 vLLM 并发;分租户分技能桶并拉长冷却 jitter。
超时泛滥?分层设置连接超时与读超时,流式单独放宽首 token;超时后只写摘要不做危险重试。
磁盘告警?缓存与日志迁数据盘、启用轮转;租用节点时优先可扩容磁盘的套餐。🚀