Перейти к содержимому

Как работает детекция аномалий

Детекция запускается ежесуточно в 04:00 UTC. Работает только на накопленной истории — для части типов нужна минимум неделя данных.

Условие: стоимость облачного сервиса за вчерашний день выше среднего за 7 предыдущих дней более чем на 10%.

cost_yesterday > avg(cost_last_7_days) × 1.10

Резолюция: стоимость возвращается к значению ≤ среднего.

Условие: CPU или memory утилизация ресурса за вчерашний день выше среднего за неделю более чем на 10%.

Резолюция: показатели нормализовались.

Условие: хост 7 дней подряд с CPU = 0 и memory = 0.

Резолюция: хост удалён или появилась активность.

Условие: облачный ресурс 3 дня подряд — network=0, CPU <1%, memory <1%.

Резолюция: ресурс удалён или появилась активность.

Условие: средняя утилизация CPU или памяти облачного ресурса ниже 40% за окно наблюдения.

Резолюция: тип ресурса изменён (right-sizing).

Условия — по названиям:

  • Unmounted disk: диск без привязки к VM.
  • Unused image: образ не используется как boot disk.
  • Old snapshot: snapshot старше 90 дней.
  • Unused IP: статический IP без назначения.

Резолюция: сущность удалена.

Условие: потенциальная экономия при коммите >$50/мес, risk score <0.5, monthly cost >$100.

Резолюция: условия перестали выполняться (нагрузка упала / цены изменились).

Условие: рекомендуемые requests для workload существенно ниже текущих.

Резолюция: requests приведены к рекомендуемым.

Условие: метрика ресурса нарушает пользовательское правило из Settings → Rules (например, «CPU > 80%»).

Резолюция: метрика вернулась в норму.

Платформа не может «удалить» аномалию — только пометить её solved при следующей генерации, если условия триггера перестали выполняться. Это гарантирует, что в Resolved попадают действительно исправленные случаи.

Вручную можно только скрыть аномалию (иконка «глаз»).

ФазаВремяЧто делает
Sync биллинга и метрикВ течение сутокНакопление данных
Генерация04:00 UTCПросмотр всех компаний, детекция, запись результатов
Проверка резолюцииТам жеПросмотр существующих active аномалий, перевод в solved при выполнении условий
Уведомления10:00 UTC (digest)Сводная рассылка по активным бот-конфигурациям
БюджетыКаждый часПроверка порогов и моментальные алерты
  • Скрывайте ложные срабатывания — они не будут показываться, но учтутся в потенциале экономии.
  • Ослабьте пороги пользовательских правил, если они чувствительны.
  • Используйте теги и allocation groups, чтобы фильтровать шум от фокусных ресурсов.