Как работает детекция аномалий
Детекция запускается ежесуточно в 04:00 UTC. Работает только на накопленной истории — для части типов нужна минимум неделя данных.
Sudden spend (облачный биллинг)
Заголовок раздела «Sudden spend (облачный биллинг)»Условие: стоимость облачного сервиса за вчерашний день выше среднего за 7 предыдущих дней более чем на 10%.
cost_yesterday > avg(cost_last_7_days) × 1.10Резолюция: стоимость возвращается к значению ≤ среднего.
Usage spike
Заголовок раздела «Usage spike»Условие: CPU или memory утилизация ресурса за вчерашний день выше среднего за неделю более чем на 10%.
Резолюция: показатели нормализовались.
Zombie host
Заголовок раздела «Zombie host»Условие: хост 7 дней подряд с CPU = 0 и memory = 0.
Резолюция: хост удалён или появилась активность.
Zombie cloud resource
Заголовок раздела «Zombie cloud resource»Условие: облачный ресурс 3 дня подряд — network=0, CPU <1%, memory <1%.
Резолюция: ресурс удалён или появилась активность.
Low utilization
Заголовок раздела «Low utilization»Условие: средняя утилизация CPU или памяти облачного ресурса ниже 40% за окно наблюдения.
Резолюция: тип ресурса изменён (right-sizing).
Unmounted disk / Unused image / Old snapshot / Unused IP
Заголовок раздела «Unmounted disk / Unused image / Old snapshot / Unused IP»Условия — по названиям:
- Unmounted disk: диск без привязки к VM.
- Unused image: образ не используется как boot disk.
- Old snapshot: snapshot старше 90 дней.
- Unused IP: статический IP без назначения.
Резолюция: сущность удалена.
CVoS recommendation
Заголовок раздела «CVoS recommendation»Условие: потенциальная экономия при коммите >$50/мес, risk score <0.5, monthly cost >$100.
Резолюция: условия перестали выполняться (нагрузка упала / цены изменились).
Right-sizing (Kubernetes)
Заголовок раздела «Right-sizing (Kubernetes)»Условие: рекомендуемые requests для workload существенно ниже текущих.
Резолюция: requests приведены к рекомендуемым.
Rule violation
Заголовок раздела «Rule violation»Условие: метрика ресурса нарушает пользовательское правило из Settings → Rules (например, «CPU > 80%»).
Резолюция: метрика вернулась в норму.
Как работает автоматическая резолюция
Заголовок раздела «Как работает автоматическая резолюция»Платформа не может «удалить» аномалию — только пометить её solved при следующей генерации, если условия триггера перестали выполняться. Это гарантирует, что в Resolved попадают действительно исправленные случаи.
Вручную можно только скрыть аномалию (иконка «глаз»).
Расписание
Заголовок раздела «Расписание»| Фаза | Время | Что делает |
|---|---|---|
| Sync биллинга и метрик | В течение суток | Накопление данных |
| Генерация | 04:00 UTC | Просмотр всех компаний, детекция, запись результатов |
| Проверка резолюции | Там же | Просмотр существующих active аномалий, перевод в solved при выполнении условий |
| Уведомления | 10:00 UTC (digest) | Сводная рассылка по активным бот-конфигурациям |
| Бюджеты | Каждый час | Проверка порогов и моментальные алерты |
Борьба с шумом
Заголовок раздела «Борьба с шумом»- Скрывайте ложные срабатывания — они не будут показываться, но учтутся в потенциале экономии.
- Ослабьте пороги пользовательских правил, если они чувствительны.
- Используйте теги и allocation groups, чтобы фильтровать шум от фокусных ресурсов.