Оглавление: зачем стек · типовые сбои · матрица маршрутов · шаги · /v1/models · разбор сбоев · FAQ
Ниже — чек-лист цепочки OpenClaw → Helicone → провайдер на облачном Mac: выравнивание model id, три класса токенов, скользящие пороги бюджета, GET /v1/models и компактный failure summary. См. также LiteLLM за шлюзом, стоимость мульти-модельного роутинга, vLLM-совместимые эндпоинты, LangGraph, OTel GenAI, Langfuse vs OTel.
Зачем объединять OpenClaw, Helicone и удалённый Mac
Apple Silicon держит fan-out: несколько подграфов бьют в разные модели через один порт шлюза. Helicone даёт аналитику на пути запроса без SDK в каждом навыке — при условии совпадения базового URL и заголовков с тем, что форвардит шлюз. Плохой случай — когда псевдоним маршрута и строка model у провайдера расходятся: ломаются бюджеты, журналы и префлайт клиента.
Три типовых боли до внедрения чек-листа
- Рассинхрон model id: маршрут шлюза, манифест графа и поле
modelв JSON не совпадают с каталогом/v1/models, клиент SDK отказывается стартовать. - Смешение секретов: один файл с админским масштабом прав попадает в рантайм агента, ротация ключа ломает и шлюз, и Helicone одновременно.
- Только дашборд без предохранителя: при деградации провайдера ретраи раздувают попытки, сокеты на Mac забиваются быстрее, чем приходит алерт финансов.
Матрица: кто владеет какой строкой
| Слой | Владеет | Должно совпасть с |
|---|---|---|
| Маршрут OpenClaw | Стабильный алиас для навыка | Полем model, которое уходит через Helicone к провайдеру |
| Helicone | Сессионные свойства, ключ проекта | Authorization провайдера и допустимым списком моделей |
| Бюджетный предохранитель | Скользящие счётчики RPM, TPM, серия 5xx | Коротким JSON с circuit и retry_after_ms, а не сырым стеком |
Воспроизводимые шаги (ветка OpenClaw 2026.5.x)
1) Установка по официальной документации. Getting Started OpenClaw для ветки 2026.5.x: Node.js 22 LTS, CLI, openclaw doctor, демон шлюза на loopback через launchd. Пин пакета и runbook должны ссылаться на одну минорную линию.
2) Базовый URL Helicone на ноге провайдера. Укажите OpenAI-совместимый endpoint Helicone для исходящих completions, например https://oai.hconeai.com/v1 в соответствии с их интеграцией OpenAI proxy. Сохраните Authorization: Bearer <PROVIDER_KEY> для вендора и добавьте Helicone-Auth: Bearer <HELICONE_API_KEY>, чтобы запросы попадали в верный проект наблюдаемости.
3) Агенты → шлюз. Клиенты навыков на локальный OpenClaw; заголовки Helicone вешает исходящая нога шлюза, не ноутбук разработчика.
4) Токены. Отдельно: доступ к шлюзу, Helicone, провайдер; файлы chmod 0400, вне git, CI без утечки env.
5) Бюджет. Окна RPM, TPM и серия 5xx в политике шлюза или прологе; при срабатывании — JSON с circuit, route, retry_after_ms.
6) Failure summary. HTTP-статус, семейство провайдера, correlation_id, id запроса Helicone при наличии; без промптов и сырых тел; короткая операторская подсказка.
7) Fan-out. Два-три параллельных completion с разными model id на одном Mac; сверьте локальные счётчики с Helicone, запретите обход шлюза в тестах.
8) Артефакты. openclaw doctor, redacted env, по одной успешной и провальной трассе на изменение маршрута.
Совместимость клиентов и GET /v1/models
SDK часто зовут GET /v1/models до chat. Зонд — только по цепочке шлюз → Helicone → провайдер как в бою; проверьте все id из манифестов.
# пример: список моделей через Helicone (подставьте ключи и путь)
curl -sS "https://oai.hconeai.com/v1/models" \
-H "Authorization: Bearer ${PROVIDER_API_KEY}" \
-H "Helicone-Auth: Bearer ${HELICONE_API_KEY}" | jq '.data[].id'При TLS на шлюзе повторите зонд на http://127.0.0.1:<порт>/v1/models с боевым Bearer и сравните id. Не дублируйте /v1 в base URL и клиенте одновременно.
Быстрый разбор инцидентов
- 401 от Helicone при рабочем прямом вызове: чаще всего отсутствует или протух
Helicone-Auth; проверьте, что шлюз пробрасывает нестандартные заголовки. - Модель не найдена «вчера работало»: сравните выводы
/v1/modelsдо и после; если в цепочке есть LiteLLM, сверьтесь с гайдом по LiteLLM. - Предохранитель срабатывает мгновенно: уменьшите клиентские ретраи, пока цепь открыта, иначе Helicone зафиксирует каждое усиление попыток, а локальные окна не остынут.
- Задержка только через шлюз: вынесите тяжёлую сериализацию логов off-thread, оставив на горячем пути только маленький failure summary.
FAQ
Заменяет ли Helicone circuit breaker? Нет: Helicone — наблюдаемость и финансовые сигналы; предохранитель по RPM, TPM и сериям ошибок остаётся на стороне Mac или шлюза.
Клиент кэширует список моделей? На время миграций уменьшите TTL, поднимите версию конфигурации в манифесте деплоя и заново выполните зонд /v1/models после каждого изменения маршрута.
Можно ли dev без Helicone? Да — второй профиль шлюза на другом loopback-порту без Helicone, но с теми же строками model id, чтобы dev и prod не расходились по смыслу маршрутов.
Почему облачный Mac mini M4? Стабильные термалы и память для fan-out; тарифы и покупка без обязательного входа.
Публичные страницы без логина: главная, технический блог, документация, тарифы, покупка и аренда.
Итог: OpenClaw 2026.5.x по докам, Helicone на ноге провайдера, выравнивание model id, три токена, локальный бюджет, /v1/models и failure summary — воспроизводимый контур мульти-модельных агентов на удалённом Mac.
Для отчёта: три класса секретов; два диффа списков моделей при смене TLS; две трассировки на релиз.