代理程式真正需要的是穩定契約與可稽核的閘道面,而非四散的自訂客戶端。將類 vLLM 之 OpenAI 相容服務視為僅對回環暴露的基礎設施,並由 OpenClaw 統一技能工具鏈、鑑權與失敗信封,才能把營運風險收斂到可預算的範圍。🧭
於遠端專用 Mac將技能統一走 OpenAI 相容推論:固定 Node 長期支援版、閘道轉發、Bearer、有上限重試、熔斷與預算、結構化失敗摘要;延伸見 LiteLLM 閘道路由、工具重試、可觀測性。
痛點拆解
其一繞過閘道則綱要校驗與權杖範圍分裂。其二無上限退避遇限流易成重試風暴。其三權重與日誌無輪替則開機卷宗易滿、載入變慢。
閘道與 OpenAI 相容推論之決策矩陣
| 關注點 | OpenClaw 閘道 | OpenAI 相容推論服務 |
|---|---|---|
| 技能工具鏈路由 | 路由名、關聯識別、請求形狀校驗 | 聊天完成、上下文與佇列語意 |
| 鑑權邊界 | 簽發最小 Bearer、稽核集中 | 金鑰僅回環、不對外廣播 |
| 熔斷與預算 | 錯誤轉摘要與建議處置 | 狀態碼、佇列與資源訊號 |
安裝、閘道、鑑權、重試與 launchd
一以 nvm 或 fnm 裝 Node 二十二長期支援版並鎖 engines 與鎖檔。二類 vLLM 服務綁回環、記上下文與資源旗標於變更紀錄。三另埠啟 OpenClaw、技能目錄唯讀、禁讀上游祕鑰。四儀表板簽短效 Bearer、檔案零四零零、與上游金鑰同視窗輪替。五限流與暫不可用採有抖動有限次退避、尊重重試間隔標頭、熔斷開則停重試。六連敗門檻加冷卻熔斷、互動與批次分併發池。七失敗信封含路由、供應商家族、狀態、關聯識別、處置提示、提示詞不入摘要日誌。八閘道與推論各一 plist、節流與保持存活、標準輸出落盤、重開機後探針驗收。
# 環境變數示意(標籤與工作目錄請依租戶調整)
export OPENAI_BASE_URL=http://127.0.0.1:8000/v1
export OPENCLAW_GATEWAY_PORT=8787
export OPENCLAW_TOKEN_FILE=$HOME/.openclaw/token
export SKILL_RETRY_MAX=3
export SKILL_RETRY_BASE_MS=250
export CIRCUIT_FAILURE_THRESHOLD=5
export CIRCUIT_COOL_DOWN_SEC=300可引用要點
- 每路由一表列別名、權杖上限、連線與讀取逾時、熔斷門檻,事件印同表。
- 日誌必含關聯識別、路由、排隊秒數,空回覆亦同。
- 夜間彙總權重與日誌卷宗使用率,逾八成警示並輪替。
建議留存診斷工具輸出與每別名煙霧請求紀錄,並將標籤工作目錄與埠寫入值班手冊以利深夜復原;大型檢查點離峰下載時宜採有線鏈路以免健康檢查誤判閘道中斷。
問答:四二九、逾時、磁碟
限流:降併發、加抖動、批次改別名、避免共用單一佇列。逾時:分連線與讀取、查閘道基底是否指到失效隧道、看預填頭端阻塞再調首字延遲。磁碟:快取獨立卷、日誌輪替、匯入新權重前清過期檢查點。