429 が続くときはゲートウェイと vLLM のどちらを先に直すか

まずゲートウェイのテナント別レートと同時接続上限を確認し、次に vLLM 側の max_num_seqs やバッチキュー、上流 API のクォータを見る。Retry-After を尊重し、リトライ回数を減らしてサーキットが開くまでトラフィックを落とす。

タイムアウトが増えたが GPU は空いている

コンテキスト長とプリフィル／デコードの分離遅延、またはディスク I/O で重いチェックポイント読み込みが起きていないか確認する。ゲートウェイの全体デッドラインが短すぎて下流が途中打ち切りになっているケースも多い。

ディスクがすぐ埋まる

vLLM のキャッシュとログ、launchd の標準出力の肥大化が典型。ログは newsyslog またはローテーション付きパスへ、モデルキャッシュは別ボリュームにマウントし、df と inode をダッシュボードで監視する。

2026 OpenClaw 実戦：リモート Mac で OpenAI 互換推論（vLLM 系）をスキル・ツールチェーンに載せる

公開面はゲートウェイだけ、vLLM 等の OpenAI 互換 APIはループバックに閉じます。論理モデル名でルートを凍結し、タイムアウト・サーキット・リトライ予算と短い失敗要約で運用を数値化します。

本ページの構成： インストールと Node · ゲートウェイとルート · 認可とリトライ · launchd 常駐 · よくある質問

エージェントが下流へ直張りすると鍵とレートと失敗理由が散ります。OpenClaw 前段で /v1/chat/completions 互換をホスト内に閉じれば検収が一列になります。LiteLLM 実戦・ツール統合・スキーマとリトライ併読推奨。

インストールと Node バージョン

リモート Mac ではシステム Node とエージェント用を分離します。fnm／nvm で Node 22 LTS を pin し、OpenClaw とゲートウェイが同一 node を参照するように。推論（Python）とは launchd ラベルとユーザーを分け、GPU と共有ライブラリの競合を避けます。

ゲートウェイとスキル・ツールチェーンのルート

スキルのベース URL はゲートウェイのホスト名のみ。実モデル名はサーバ側マッピングのみ。vLLM は 127.0.0.1 のみ待受、外向きは閉じます。写像はリポジトリでレビュー可能に。

レイヤ	役割	固定すべき数値・文字列
ゲートウェイ	認可、許可モデル、レート、全体デッドライン	Bearer スコープ、論理モデル許可リスト、タイムアウト秒
OpenAI 互換 API	トークナイズと生成、キュー	max_num_seqs、コンテキスト長、キャッシュディレクトリ
エージェント	ツール呼び出しとプロンプト	論理モデル名、相関 ID ヘッダ、リトライ方針フラグ

認可・サーキット予算・失敗要約・リトライ

認可：短命 Bearer はゲートウェイのみ検証、下流はループバック内トークンまたは無認証。サーキットと予算：連続失敗で開閉し、同時接続とセッション内リトライ上限を README に数値化。失敗要約：クライアントには HTTP ステータス・理由コード・相関 ID のみ。リトライ：429／再試行可能 5xx のみ指数バックオフ＋ジッター、Retry-After 優先。副作用ツールはリトライ無効。

launchd による常駐プロセス（デーモン）の要点

LaunchAgent または LaunchDaemon でゲートウェイと vLLM を別ラベル化。ThrottleInterval で再起動嵐を抑え、環境変数に NODE_ENV とベース URL。標準出力はローテ付きパスへ。openclaw doctor を週次で回しドリフト検知。

よくある質問（429／タイムアウト／ディスク）

429：ゲートウェイのテナント別レートを先に調整し、vLLM の同時シーケンスと外部 API クォータを相関 ID で切り分け。

タイムアウト：ゲートウェイの全体デッドラインが推論より短いケースが多い。長文はプリフィルが伸びるのでデッドラインとストリーミングをセットで見直し。

ディスク：ウェイト・KV キャッシュ・巨大ログを疑い、キャッシュは別ボリューム、launchd ログはローテ、df -h／inode を定期監視。

公開（ログイン不要）：料金・購入・ヘルプ・テックブログ。

2026 OpenClaw 実戦：リモート Mac で OpenAI 互換推論（vLLM 系）をスキル・ツールチェーンに載せ、サーキット予算と失敗要約回伝まで再現する

インストールと Node バージョン

ゲートウェイとスキル・ツールチェーンのルート

認可・サーキット予算・失敗要約・リトライ

launchd による常駐プロセス（デーモン）の要点

よくある質問（429／タイムアウト／ディスク）

本番に近い検収は専用リモート Mac で