« Sans cadence de refresh ni slots pour les outils, un serveur MCP transforme l’Agent Mac en amplificateur de bruit dès que la charge part sur un nœud distant facturé à l’heure. »

Sur cette page : Frictions · Matrice · Étapes · Checklist · Repères

Ce guide condense une matrice décision et une checklist pour Resources MCP, concurrence d’outils et validation coût latence sur Mac loué. Croisez avec la matrice smolagents et OpenWebUI si l’UI précède l’agent.

Frictions avant passage à l’échelle

1. Des subscriptions trop fréquentes sur les Resources MCP saturent la boucle agent-modèle : relectures coûteuses et traces bruitées dès que plusieurs clients partagent l’hôte.

2. Sans slots explicites, les outils s’empilent, disputent mémoire unifiée et sockets ; on croit à une panne modèle alors que le goulet est orchestrationnel.

3. Sans timeouts et plafonds jetons séparés pour outils, synthèse et Resources, le Mac distant masque une dérive que la checklist seule révèle en recette.

Matrice décision : refresh, slots, jetons, timeouts

Contrat type entre architectes MCP et acheteurs d’infra pour un Mac physique en SSH ou derrière une passerelle compatible OpenAI.

Axe Profil prudent Profil équilibré Profil sensible marché
Refresh Resources Trente secondes catalogues statiques Dix à quinze secondes semi volatils Cinq secondes avec dédoublonnage événement
Slots outils concurrents Deux slots FIFO stricte Quatre slots priorité lecture Six slots certifiés plus deux opportunistes
Budget jetons par cycle Vingt-quatre mille dont six mille Resources Quarante-huit mille arrêt quatre-vingt-quinze pour cent Soixante-quatre mille répartition écrite
Timeouts Premier jeton quarante-cinq secondes, outil huit secondes, transport douze secondes Premier jeton soixante secondes, outil douze secondes, Resource cinq secondes Premier jeton quatre-vingt-dix secondes, outil vingt secondes annulation coopérative

Moindre privilège sur les URI, corrélation unique dans les journaux ; sinon la matrice est décorative. Comparez sandbox via E2B isolé avant d’élargir le réseau des outils.

Étapes d’industrialisation sur Mac loué

Parcours type sur Apple Silicon figé ; gardez l’ordre pour limiter l’écart banc local versus nœud distant.

  1. Cartographier : subscriptions, cardinalité, sensibilité ; classes statique ou volatile ; refresh minimal selon charge.
  2. Slots : plafond d’outils simultanés ; séparer mutations et lectures ; pas de session réseau implicite partagée.
  3. Budgets et timeouts : aligner jetons, premier jeton et timeout outil sur la colonne choisie ; codes stables sur dépassement.
  4. Auth : jetons scoped par serveur MCP ; rotation via IdP ; pas de secrets longue durée en clair sur le disque distant.
  5. Sandbox : FS et API externes dans conteneur à politique réseau listée (cf. E2B).
  6. Charge : cinq agents dix minutes ; thermique et coût vs tarifs et achat ; archiver journaux.
REFRESH_STATIC_SEC=30
REFRESH_VOLATILE_SEC=10
TOOL_SLOTS=4
MAX_TOKENS_PER_CYCLE=48000
TIMEOUT_FIRST_TOKEN_SEC=60
TIMEOUT_TOOL_SEC=12

Branches RunnableParallel : harmoniser timeouts avec RunnableParallel passerelle.

Checklist d’acceptation coût et risque

  • Subscriptions : propriétaire, refresh versionné, test taille payload.
  • Concurrence : slots visibles en métrique plus file si saturation.
  • Jetons et temps : profil équilibré quarante-huit mille jetons, soixante secondes premier jeton, douze secondes outil — ou dérogation écrite.
  • Sandbox : pas de mutation hors conteneur ; surface réseau listée.
  • Auth : rotation documentée, scopes minimaux, audit accès MCP.

Repères chiffrés pour revue d’architecture

  • Trois subscriptions max par agent sans bus dédié ; refresh médian dix secondes semi volatil.
  • Quatre slots outils par défaut sur Mac M4 loué si le modèle partage la mémoire unifiée.
  • Quarante-huit mille jetons, coupure quatre-vingt-quinze pour cent ; outil douze secondes, transport quinze secondes.
  • Premier jeton quarante-cinq à soixante secondes selon prudence ou équilibre.

MCP Resources disciplinées par refresh et slots rendent l’Agent Mac auditable sur nœud distant et clarifient la facturation horaire. Cette discipline évite les dérives. Pour industrialiser sans immobiliser de matériel, centralisez la recette sur un Mac mini M4 loué LlmMac, puis enchaînez blog, accueil et documentation pour cadrer exploitation et budget.