Жизненный цикл и основные этапы проблемы

Материал из Документация Ключ-АСТРОМ

Механизм поиска первопричин ИИ собирает все отдельные события, относящиеся к одному и тому же инциденту. В результате Davis® создает проблему, которая ссылается на всю информацию, имеющую отношение к инциденту, например, на отдельные события, обнаруженные на графе затронутой топологии. На рисунке ниже показано, как два отдельных события анализируются в рамках одной задачи, созданной ИИ.

Imageавав.png

Как видите, каждое событие имеет свои собственные временные метки начала и окончания. Каждый источник событий использует различные скользящие временные окна наблюдения, которые мы называем временем анализа событий (показаны желтым цветом).

Давайте рассмотрим пример события метрики, настроенного на использование 5-минутного скользящего окна, в котором 3-минутные выборки должны нарушить пороговое значение, чтобы вызвать событие. В этом случае метрика начинает нарушать пороговое значение за 3 минуты до отметки времени, когда возникает событие. Момент первого возникновения нарушения отмечается как временная метка начала анализа события, поэтому информация о том, когда именно началось нарушение, не теряется.

Поскольку временная метка начала анализа события представляет собой самый ранний момент времени, когда наблюдалось состояние нарушения, временная метка окончания анализа события представляет собой момент времени после того, как собраны все необходимые выборки нарушений и поднята проблема Davis®.

Поскольку каждое событие, связанное с проблемой, использует скользящее окно, каждая проблема имеет завершающий период, в течение которого закрытая проблема может быть открыта повторно. Это называется периодом повторного открытия, и его максимальная продолжительность составляет 30 минут.

Если проблема остается открытой более 90 минут, по истечении 90 минут в нее не будут добавлены новые события. Это не позволяет Davis® собирать несвязанную информацию о длительных инцидентах (например, синтетический тест постоянно терпит неудачу и проблемы остаются открытыми в течение нескольких недель).

Краткое описание жизненного цикла проблемы:

  • В отдельных событиях используются скользящие окна анализа переменных.
  • Проблема возникает в метке времени анализа завершения события.
  • Продолжительность жизни проблемы определяется продолжительностью жизни отдельных событий в задаче.
  • Задача считается закрытой, когда закрыты все события в задаче.
    • Закрытую проблему можно открыть повторно в течение 30 минут.
  • Если проблема длится более 90 минут, новые события не будут объединены после 90-минутного периода — вместо этого будет поднята новая проблема.