目录:痛点 · 决策矩阵 · 批处理与缓冲 · 可执行占位 · 远程验收清单 · 落地六步 · 可引用 · 问答
面向 M4 统一内存 上离线转写、批量 TTS 或多模态对齐:先锁采样率与批大小阶梯,用缓冲窗口吃流式突发,再把临时目录钉快盘并在远程 Mac夜跑签核机时。购买、定价、帮助 免登录;文本栈见 MLX 文本矩阵。
痛点:(1)交互与离线批处理同进程致缓冲欠载;(2)TMPDIR 在系统盘顶满 I O;(3)坏源未隔离拖死整批。
决策矩阵(语音栈 × 约束)
| 维度 | MLX Audio 批处理取向 | 脚本化 FFmpeg 链 | 取舍提示 |
|---|---|---|---|
| 算子与内存 | mlx 路径峰值随批与窗长叠。 | 子进程链拷贝多难估峰值。 | 要签字先 mlx 并做批扫描。 |
| 语音 I O | 固定采样率独占会话。 | 采集在外层进程。 | 看端到端分位勿只看均值。 |
| 临时与缓存 | 波形导出要快盘配额。 | 管道可零落盘难排障。 | 生产显式临时根好清理。 |
| 远程 Mac | 通宵批跑易对机时。 | 注意挂载与 SSH 会话。 | 免合盖打断长批。 |
批处理会话与缓冲窗口
批处理会话内共享权重与同采样率,用恒定批大小阶梯加压再跨会话改档。缓冲窗口按最长样本加余量估,流式预留突发;交互与离线分队列免 I O 互抢致实时因子飘红。
可执行占位:批大小、采样率、临时目录、失败重试
示例可贴 launchd 或 CI,路径自换。
# 磁盘临时目录:指向快盘,避免与系统快照争用
export TMPDIR="$HOME/Scratch/mlx-audio-wav"
mkdir -p "$TMPDIR"
# 采样率:先与模型卡对齐,例如 16 kHz 基线再评估 24 kHz
export MLX_AUDIO_SAMPLE_RATE_HZ=16000
# 批大小:会话内阶梯 1→2→4→8,记录每档峰值内存与实时因子
export MLX_AUDIO_BATCH_SIZE=4
# 失败重试:可恢复错误最多 3 次指数退避;坏源移隔离前缀
export MLX_AUDIO_MAX_RETRIES=3
export MLX_AUDIO_QUARANTINE_DIR="$TMPDIR/quarantine"重试分清可恢复与坏源:坏源进隔离并打关联键。
远程节点成本验收清单
- 机时:夜跑分钟乘并发批,CSV 粒度对齐账单租户键。
- 磁盘:临时根在持久卷可配额,跑完幂等清。
- 实时:交互实时因子小于一,批看尾延迟分位。
- 失败:重试与隔离占比低于合同阈。
- 复现:权重校验采样率批大小 TMPDIR 写入版说明。
落地六步
- 冻结权重与语音 I O表禁隐式重采样。
- 快盘 TMPDIR 与隔离目录仅运行户可写。
- 批大小从一阶梯扫峰值与交换。
- 缓冲长度定好交互离线分队列。
- 有限次失败重试加坏源隔离。
- 远程 Mac 重放高峰签机时再扩面。
可引用信息
- 批大小乘采样率定峰值与临时体积须同任务测。
- 缓冲过短掉帧过长吃内存,先最长样本加两成。
- 远程以夜跑 CSV 对齐合同勿只测干净本机。
常见问题
要看路由篇吗?下游进 LLM 再读 路由矩阵;本文主看波形实时。🚀
向量一起调?入库另任务,参数见 向量篇 勿混缓冲表。
音频与文本同进程?可但分池免 KV 与波形抢带宽。