三層分離と互換面の凍結。遅延・並行・キャッシュ・フォールバックを表にし置換欄で数値化しリモートマック検収へ繋ぎます。
構成:要件のレイヤ分け·ルーティング戦略·コストとエスエルエー·よくある質問·コンバージョン
再試行でキューが尖るため集約ゲートウェイで契約を固定します。ルート実戦·可観測性·ローカル推論参照。
要件のレイヤ分け(需要の階層)
対話短タイムアウト体験優先。エージェント並行プール分離と厳しめサーキット。夜間バッチ待ちと最大バッチを上げ翌朝まで許容。三層を一設定に混ぜない。
ルーティング戦略
論理名のみ公開し実体は集約層内。認可は手前で返却形は互換で統一。
| 経路 | 遅延 | 並行 | キャッシュ | フォールバック |
|---|---|---|---|---|
| クラウド直結 | 地域差 | 上限早い | 規約依存 | 別地域・別系列段階 |
| 同一機 | 行列で尾部 | コア天井 | 方針次第 | 量子化か優先度 |
| リモートマック | 往復乗る | 隔離易 | 定型のみ可 | 溢出し前見積 |
秒={{ゲートウェイ秒}}
対話同時={{対話同時数}}
同時={{エージェント同時数}}
最大={{バッチトークン}}
毫秒={{待ち毫秒}}
予備={{予備論理名}}
一層別ファイル化二論理名凍結三尾部で自動フォールバック四定型のみキャッシュ五夜間リプレイで単価と失敗を残す。
コストとエスエルエー
百分位に可用性と誤答を併記。別名ごと単価待ち遮断を一列化し単価差は事前承認。検収は往復空き容量夜間完了を箇条書きしノート差分を添付。観測は九十五パーセンタイル秒と平均キューとサーキット回数。コストは千トークン単価と夜間一回換算。合意はフォールバック上限と所在地ラベル。
よくある質問
対話とバッチ同居は分離か優先度で対話先。フォールバック二段まで。料金購入閲覧はログイン不要。
コンバージョン
専用リモートマックへ写し単価と尾部を固定後に外向き公開。公開料金購入へ。