本ページの構成: インストールと Node · ゲートウェイとルート · 認可とリトライ · launchd 常駐 · よくある質問
エージェントが下流へ直張りすると鍵とレートと失敗理由が散ります。OpenClaw 前段で /v1/chat/completions 互換をホスト内に閉じれば検収が一列になります。LiteLLM 実戦・ツール統合・スキーマとリトライ併読推奨。
インストールと Node バージョン
リモート Mac ではシステム Node とエージェント用を分離します。fnm/nvm で Node 22 LTS を pin し、OpenClaw とゲートウェイが同一 node を参照するように。推論(Python)とは launchd ラベルとユーザーを分け、GPU と共有ライブラリの競合を避けます。
ゲートウェイとスキル・ツールチェーンのルート
スキルのベース URL はゲートウェイのホスト名のみ。実モデル名はサーバ側マッピングのみ。vLLM は 127.0.0.1 のみ待受、外向きは閉じます。写像はリポジトリでレビュー可能に。
| レイヤ | 役割 | 固定すべき数値・文字列 |
|---|---|---|
| ゲートウェイ | 認可、許可モデル、レート、全体デッドライン | Bearer スコープ、論理モデル許可リスト、タイムアウト秒 |
| OpenAI 互換 API | トークナイズと生成、キュー | max_num_seqs、コンテキスト長、キャッシュディレクトリ |
| エージェント | ツール呼び出しとプロンプト | 論理モデル名、相関 ID ヘッダ、リトライ方針フラグ |
認可・サーキット予算・失敗要約・リトライ
認可:短命 Bearer はゲートウェイのみ検証、下流はループバック内トークンまたは無認証。サーキットと予算:連続失敗で開閉し、同時接続とセッション内リトライ上限を README に数値化。失敗要約:クライアントには HTTP ステータス・理由コード・相関 ID のみ。リトライ:429/再試行可能 5xx のみ指数バックオフ+ジッター、Retry-After 優先。副作用ツールはリトライ無効。
launchd による常駐プロセス(デーモン)の要点
LaunchAgent または LaunchDaemon でゲートウェイと vLLM を別ラベル化。ThrottleInterval で再起動嵐を抑え、環境変数に NODE_ENV とベース URL。標準出力はローテ付きパスへ。openclaw doctor を週次で回しドリフト検知。
よくある質問(429/タイムアウト/ディスク)
429:ゲートウェイのテナント別レートを先に調整し、vLLM の同時シーケンスと外部 API クォータを相関 ID で切り分け。
タイムアウト:ゲートウェイの全体デッドラインが推論より短いケースが多い。長文はプリフィルが伸びるのでデッドラインとストリーミングをセットで見直し。
ディスク:ウェイト・KV キャッシュ・巨大ログを疑い、キャッシュは別ボリューム、launchd ログはローテ、df -h/inode を定期監視。