Перейти к содержимому

Обновления и обслуживание

Платформа обновляется заменой Helm-релизов API-службы и консоли. Миграции БД выполняются автоматически на старте новой версии.

  • Patch-релизы (1.0.x) — выходят каждые 2–4 недели. Совместимы с агентами той же минорной версии.
  • Minor-релизы (1.x.0) — каждые 1–3 месяца. Могут содержать новые возможности и требовать обновления агентов.
  • Major-релизы — редко, заранее объявляются.
  1. Прочитайте release notes, поставляемые с дистрибутивом. Обратите внимание на секции Breaking changes и Migration notes.

  2. Сделайте бэкап БД. pg_dump или managed-snapshot. Без этого шага дальше не двигайтесь.

  3. Обновите API-службу:

    Окно терминала
    helm upgrade api-service ./charts/api-service \
    -n opsman \
    -f values.prod.yaml \
    --set image.tag=1.1.0

    Миграции БД применятся автоматически. В логах это будет видно как последовательные записи migration N applied.

  4. Проверьте /healthz и тестовый логин в консоль.

  5. Обновите консоль:

    Окно терминала
    helm upgrade console ./charts/console \
    -n opsman \
    -f values.prod.yaml \
    --set image.tag=1.1.0
  6. Обновите агенты в клиентских кластерах (если это требуется новой версией):

    Окно терминала
    helm upgrade metrics-collector ./charts/metrics-collector \
    -n opsman \
    -f values.prod.yaml \
    --set image.tag=1.1.0
  7. Проверьте ingest: в течение 2–3 минут на Dashboard должны появиться свежие данные.

Если после обновления возникли проблемы:

Окно терминала
helm rollback api-service 0 -n opsman
helm rollback console 0 -n opsman
  • Короткий downtime (до 30 секунд) на pod-replace’е возможен при одном реплике. Для нулевого downtime — деплойте API-службу с replica=2 и rolling update.
  • Для major-релизов заранее планируйте окно обслуживания и уведомьте пользователей.

Рекомендуемые алерты для on-premise:

  • api-service /healthz != 200 в течение 2 минут.
  • Рост ошибок в логах выше базового уровня.
  • Рост размера ключевых таблиц БД (resource_usage, cloud_entity_metrics) за пределами ожидаемого.
  • Отсутствие новых данных от агента более 15 минут.

Подробнее — в разделе Observability для администраторов.

  • JWT-ключ: при ротации все пользователи переподключатся. Планируйте окно.
  • Company token: при ротации обновите TOKEN в Helm values агентов всех подключённых кластеров.
  • Пароли БД: смена через ALTER USER, обновление DATABASE_URL, helm upgrade.
  • SMTP-пароль: обновление env API-службы, helm upgrade.