Les projets MLX Audio se gagnent ou se perdent sur un contrat d’E/S voix lisible, non sur le dernier routeur LLM installé en coup de vent. Traitez le batch, les secondes de tampon annulaire, le taux d’échantillonnage, un TMPDIR véloce et des réessais d’échec explicitement bornés comme des exigences signées avant de débattre des jetons.

Sur cette page : Friction · Matrice · Sessions batch · Variables exécutables · Checklist coût · Déploiement · Repères citables · FAQ

Arrivé depuis le routage texte ou l’index vectoriel, gardez ces guides pour embeddings et quotas ; ils ne traitent ni formes d’onde ni contrats de capture. Ici : graphes MLX audio, files courtes, disque scratch et pourcentiles d’E/S. Croisez MLX-LM batch texte si voix et langage partagent un hôte, mais la voix exige des métriques propres en millisecondes. Tarifs, achat, aide restent publics sans connexion.

Où les pipelines se fissurent sans bruit

Première friction : dialogue temps réel et batch dans une même file affament les tampons ; les sous-alimentations passent pour des bugs modèle.

Deuxième friction : un TMPDIR lent plafonne l’E/S ; vos balayages de taille de batch accusent alors le lot à tort.

Troisième friction : réessais sans quarantaine sur fichiers corrompus empoisonnent le fan-out tant que les tentatives ne sont pas bornées par classe d’erreur.

Matrice décision : chemin MLX Audio versus chaîne FFmpeg lourde

Dimension Trajectoire MLX Audio Chaîne FFmpeg dense Lecture opérationnelle
Mémoire Crêtes lot et fenêtre dans la RAM unifiée Copies et filtres masquent les pics MLX d’abord ; FFmpeg seulement aux bords mesurés
E/S voix Taux stable dans le graphe Capture et resample hors modèle Percentiles bout à bout, pas moyennes seules
Disque temporaire Sensible au TMPDIR Spill disque même si la RAM va bien TMP sur NVMe ou volume persistant
Mac distant Nuits alignées sur heures louées SSH complique la capture live Trempage sur nœud dédié, pas portable

Sessions batch et fenêtres tampon

Réutilisez poids et méta d’échantillonnage dans une session MLX Audio, montez la taille de batch par paliers, puis ouvrez une session neuve pour le palier suivant afin d’éviter de mélanger des hypothèses de mémoire. Tampons au clip maximal accepté plus environ vingt pour cent de marge pour absorber les micro-rafales sans réinitialiser le flux. Pools séparés interactif et hors ligne : la file batch ne doit pas voler les échéances temps réel. Si voix et texte cohabitent, tracez bande passante unifiée et facteur temps réel ; les seuls jetons par seconde masquent la contention réelle.

Environnement exécutable : batch, taux, répertoire temporaire, réessais

Exportez les molettes que votre runbook peut greper. Les noms ci-dessous sont un contrat illustratif — mappez-les à votre orchestrateur en conservant la sémantique.

export TMPDIR="$HOME/Scratch/mlx-audio-wav" mkdir -p "$TMPDIR" "$TMPDIR/quarantine" export MLX_AUDIO_SAMPLE_RATE_HZ=16000 export MLX_AUDIO_BATCH_SIZE=4 export MLX_AUDIO_MAX_RETRIES=3 export MLX_AUDIO_QUARANTINE_DIR="$TMPDIR/quarantine"

Balayez les lots de un à huit en notant RSS crête, facteur temps réel et p95 secondes par extrait ; arrêtez-vous au genou où la queue explose. Réessais réservés au transport ou au throttle ; en cas d’échec de somme de contrôle, déposez l’entrée en quarantaine et ne réenqueuez pas les fichiers voisins pour éviter l’avalanche.

Checklist d’acceptation des coûts sur Mac distant

  • Heures machine — mur × voies parallèles ; CSV + clé facturation loueur.
  • Quota disque — nettoyage TMPDIR idempotent et borné.
  • SLA temps réel — interactif <1 s aux percentiles convenus ; batch : p95 file séparé.
  • Budget d’échec — réessais/h et volume quarantaine plafonnés pour la finance.
  • Reproductibilité — hashes poids, taux, tableau batch, TMPDIR + métriques.

Six étapes de déploiement mesuré

  1. Publiez le contrat d’E/S voix : conteneurs, canaux et interdiction des rééchantillonnages implicites.
  2. Montez un TMPDIR rapide et des répertoires quarantaine par utilisateur avec permissions strictes.
  3. Exécutez l’échelle de batch par paliers tout en notant genoux mémoire et latence.
  4. Ajustez fenêtres tampon et séparation de files ; rejouez depuis disque les clips les plus pénalisants.
  5. Câblez un backoff exponentiel plafonné pour fautes récupérables seulement ; stoppez le fan-out sur entrées empoisonnées.
  6. Rejouez les tranches de pointe sur une location Mac distant, comparez au portable de référence, puis signez les lignes d’heures machine avant d’étendre le contrat.

Repères citables pour revue d’architecture

  • Le produit taille de batch × taux d’échantillonnage fixe charge MAC et volume WAV scratch par minute : tracez les deux courbes sur un même tableau pour les revues de capabilité.
  • Couverture tampon égale durée du clip le plus long plus environ vingt pour cent jusqu’à ce qu’un sprint métrique impose une révision.
  • Les exports CSV des nuits sur Mac distant doivent reprendre le schéma burndown que la finance valide déjà pour l’inférence accélérée.

FAQ

Nouveau routage LLM ? Non : routage = jetons ; ici ms audio et disque scratch.

Quotas vectoriels ? Ingest séparé des tampons voix.

Multimodal ? Pools isolés ; pas de micro-batch audio sur préfill texte sans plafond écrit.

Pages publiques (sans connexion) : comparez les tarifs et parcourez l’achat, consultez le centre d’aide, puis l’index du blog technique pour d’autres guides MLX et passerelles.