公開面はゲートウェイだけvLLM 等の OpenAI 互換 APIはループバックに閉じます。論理モデル名でルートを凍結し、タイムアウト・サーキット・リトライ予算と短い失敗要約で運用を数値化します。

本ページの構成: インストールと Node · ゲートウェイとルート · 認可とリトライ · launchd 常駐 · よくある質問

エージェントが下流へ直張りすると鍵とレートと失敗理由が散ります。OpenClaw 前段で /v1/chat/completions 互換をホスト内に閉じれば検収が一列になります。LiteLLM 実戦ツール統合スキーマとリトライ併読推奨。

インストールと Node バージョン

リモート Mac ではシステム Node とエージェント用を分離します。fnm/nvm で Node 22 LTS を pin し、OpenClaw とゲートウェイが同一 node を参照するように。推論(Python)とは launchd ラベルとユーザーを分け、GPU と共有ライブラリの競合を避けます。

ゲートウェイとスキル・ツールチェーンのルート

スキルのベース URL はゲートウェイのホスト名のみ。実モデル名はサーバ側マッピングのみ。vLLM は 127.0.0.1 のみ待受、外向きは閉じます。写像はリポジトリでレビュー可能に。

レイヤ 役割 固定すべき数値・文字列
ゲートウェイ 認可、許可モデル、レート、全体デッドライン Bearer スコープ、論理モデル許可リスト、タイムアウト秒
OpenAI 互換 API トークナイズと生成、キュー max_num_seqs、コンテキスト長、キャッシュディレクトリ
エージェント ツール呼び出しとプロンプト 論理モデル名、相関 ID ヘッダ、リトライ方針フラグ

認可・サーキット予算・失敗要約・リトライ

認可:短命 Bearer はゲートウェイのみ検証、下流はループバック内トークンまたは無認証。サーキットと予算:連続失敗で開閉し、同時接続とセッション内リトライ上限を README に数値化。失敗要約:クライアントには HTTP ステータス・理由コード・相関 ID のみ。リトライ:429/再試行可能 5xx のみ指数バックオフ+ジッター、Retry-After 優先。副作用ツールはリトライ無効。

launchd による常駐プロセス(デーモン)の要点

LaunchAgent または LaunchDaemon でゲートウェイと vLLM を別ラベル化。ThrottleInterval で再起動嵐を抑え、環境変数に NODE_ENV とベース URL。標準出力はローテ付きパスへ。openclaw doctor を週次で回しドリフト検知。

よくある質問(429/タイムアウト/ディスク)

429:ゲートウェイのテナント別レートを先に調整し、vLLM の同時シーケンスと外部 API クォータを相関 ID で切り分け。

タイムアウト:ゲートウェイの全体デッドラインが推論より短いケースが多い。長文はプリフィルが伸びるのでデッドラインとストリーミングをセットで見直し。

ディスク:ウェイト・KV キャッシュ・巨大ログを疑い、キャッシュは別ボリューム、launchd ログはローテ、df -h/inode を定期監視。

公開(ログイン不要):料金購入ヘルプテックブログ