Sur cette page : Frictions · Matrice · Étapes · Checklist · Repères
Ce guide condense une matrice décision et une checklist pour Resources MCP, concurrence d’outils et validation coût latence sur Mac loué. Croisez avec la matrice smolagents et OpenWebUI si l’UI précède l’agent.
Frictions avant passage à l’échelle
1. Des subscriptions trop fréquentes sur les Resources MCP saturent la boucle agent-modèle : relectures coûteuses et traces bruitées dès que plusieurs clients partagent l’hôte.
2. Sans slots explicites, les outils s’empilent, disputent mémoire unifiée et sockets ; on croit à une panne modèle alors que le goulet est orchestrationnel.
3. Sans timeouts et plafonds jetons séparés pour outils, synthèse et Resources, le Mac distant masque une dérive que la checklist seule révèle en recette.
Matrice décision : refresh, slots, jetons, timeouts
Contrat type entre architectes MCP et acheteurs d’infra pour un Mac physique en SSH ou derrière une passerelle compatible OpenAI.
| Axe | Profil prudent | Profil équilibré | Profil sensible marché |
|---|---|---|---|
| Refresh Resources | Trente secondes catalogues statiques | Dix à quinze secondes semi volatils | Cinq secondes avec dédoublonnage événement |
| Slots outils concurrents | Deux slots FIFO stricte | Quatre slots priorité lecture | Six slots certifiés plus deux opportunistes |
| Budget jetons par cycle | Vingt-quatre mille dont six mille Resources | Quarante-huit mille arrêt quatre-vingt-quinze pour cent | Soixante-quatre mille répartition écrite |
| Timeouts | Premier jeton quarante-cinq secondes, outil huit secondes, transport douze secondes | Premier jeton soixante secondes, outil douze secondes, Resource cinq secondes | Premier jeton quatre-vingt-dix secondes, outil vingt secondes annulation coopérative |
Moindre privilège sur les URI, corrélation unique dans les journaux ; sinon la matrice est décorative. Comparez sandbox via E2B isolé avant d’élargir le réseau des outils.
Étapes d’industrialisation sur Mac loué
Parcours type sur Apple Silicon figé ; gardez l’ordre pour limiter l’écart banc local versus nœud distant.
- Cartographier : subscriptions, cardinalité, sensibilité ; classes statique ou volatile ; refresh minimal selon charge.
- Slots : plafond d’outils simultanés ; séparer mutations et lectures ; pas de session réseau implicite partagée.
- Budgets et timeouts : aligner jetons, premier jeton et timeout outil sur la colonne choisie ; codes stables sur dépassement.
- Auth : jetons scoped par serveur MCP ; rotation via IdP ; pas de secrets longue durée en clair sur le disque distant.
- Sandbox : FS et API externes dans conteneur à politique réseau listée (cf. E2B).
- Charge : cinq agents dix minutes ; thermique et coût vs tarifs et achat ; archiver journaux.
REFRESH_STATIC_SEC=30
REFRESH_VOLATILE_SEC=10
TOOL_SLOTS=4
MAX_TOKENS_PER_CYCLE=48000
TIMEOUT_FIRST_TOKEN_SEC=60
TIMEOUT_TOOL_SEC=12Branches RunnableParallel : harmoniser timeouts avec RunnableParallel passerelle.
Checklist d’acceptation coût et risque
- Subscriptions : propriétaire, refresh versionné, test taille payload.
- Concurrence : slots visibles en métrique plus file si saturation.
- Jetons et temps : profil équilibré quarante-huit mille jetons, soixante secondes premier jeton, douze secondes outil — ou dérogation écrite.
- Sandbox : pas de mutation hors conteneur ; surface réseau listée.
- Auth : rotation documentée, scopes minimaux, audit accès MCP.
Repères chiffrés pour revue d’architecture
- Trois subscriptions max par agent sans bus dédié ; refresh médian dix secondes semi volatil.
- Quatre slots outils par défaut sur Mac M4 loué si le modèle partage la mémoire unifiée.
- Quarante-huit mille jetons, coupure quatre-vingt-quinze pour cent ; outil douze secondes, transport quinze secondes.
- Premier jeton quarante-cinq à soixante secondes selon prudence ou équilibre.
MCP Resources disciplinées par refresh et slots rendent l’Agent Mac auditable sur nœud distant et clarifient la facturation horaire. Cette discipline évite les dérives. Pour industrialiser sans immobiliser de matériel, centralisez la recette sur un Mac mini M4 loué LlmMac, puis enchaînez blog, accueil et documentation pour cadrer exploitation et budget.
Navigation rapide : blog public, accueil, forfaits et tarifs, achat, documentation SSH et VNC.