Обновления и обслуживание
Платформа обновляется заменой Helm-релизов API-службы и консоли. Миграции БД выполняются автоматически на старте новой версии.
Периодичность
Заголовок раздела «Периодичность»- Patch-релизы (1.0.x) — выходят каждые 2–4 недели. Совместимы с агентами той же минорной версии.
- Minor-релизы (1.x.0) — каждые 1–3 месяца. Могут содержать новые возможности и требовать обновления агентов.
- Major-релизы — редко, заранее объявляются.
Типовая процедура обновления
Заголовок раздела «Типовая процедура обновления»-
Прочитайте release notes, поставляемые с дистрибутивом. Обратите внимание на секции Breaking changes и Migration notes.
-
Сделайте бэкап БД.
pg_dumpили managed-snapshot. Без этого шага дальше не двигайтесь. -
Обновите API-службу:
Окно терминала helm upgrade api-service ./charts/api-service \-n opsman \-f values.prod.yaml \--set image.tag=1.1.0Миграции БД применятся автоматически. В логах это будет видно как последовательные записи
migration N applied. -
Проверьте
/healthzи тестовый логин в консоль. -
Обновите консоль:
Окно терминала helm upgrade console ./charts/console \-n opsman \-f values.prod.yaml \--set image.tag=1.1.0 -
Обновите агенты в клиентских кластерах (если это требуется новой версией):
Окно терминала helm upgrade metrics-collector ./charts/metrics-collector \-n opsman \-f values.prod.yaml \--set image.tag=1.1.0 -
Проверьте ingest: в течение 2–3 минут на Dashboard должны появиться свежие данные.
Откат (rollback)
Заголовок раздела «Откат (rollback)»Если после обновления возникли проблемы:
helm rollback api-service 0 -n opsmanhelm rollback console 0 -n opsmanРегламентные окна
Заголовок раздела «Регламентные окна»- Короткий downtime (до 30 секунд) на pod-replace’е возможен при одном реплике. Для нулевого downtime — деплойте API-службу с replica=2 и rolling update.
- Для major-релизов заранее планируйте окно обслуживания и уведомьте пользователей.
Мониторинг платформы
Заголовок раздела «Мониторинг платформы»Рекомендуемые алерты для on-premise:
api-service /healthz != 200в течение 2 минут.- Рост ошибок в логах выше базового уровня.
- Рост размера ключевых таблиц БД (
resource_usage,cloud_entity_metrics) за пределами ожидаемого. - Отсутствие новых данных от агента более 15 минут.
Подробнее — в разделе Observability для администраторов.
Ротация секретов
Заголовок раздела «Ротация секретов»- JWT-ключ: при ротации все пользователи переподключатся. Планируйте окно.
- Company token: при ротации обновите
TOKENв Helm values агентов всех подключённых кластеров. - Пароли БД: смена через
ALTER USER, обновлениеDATABASE_URL,helm upgrade. - SMTP-пароль: обновление env API-службы,
helm upgrade.