Настройка и мониторинг Целей уровня обслуживания (SLO) с помощью Ключ-АСТРОМ

Материал из Документация Ключ-АСТРОМ

Обзор SLO

В списке определенных целей уровня обслуживания (SLO) в среде мониторинга Ключ-АСТРОМ на странице Цели уровня обслуживания отображается важная информация, такая как текущий статус, бюджет ошибок и скорость сжигания , цель, предупреждение, количество открытых проблем из общего числа. количество проблем для селектора объекта SLO и период времени, в течение которого должен оцениваться SLO.

Анализировать проблемы

Если есть какие-либо открытые проблемы, связанные с SLO, значение в столбце Открытых/всего проблем для SLO помечается красным символом предупреждения. Выберите значение, чтобы отобразить страницу « Проблемы », отфильтрованную с помощью соответствующего селектора объектов. Дополнительные сведения об анализе проблем см. в разделе Обнаружение и анализ проблем .

Детали SLO

Разверните сведения о SLO для получения дополнительной информации, например:

  • Селекторы метрик и сущностей SLO
  • График, представляющий оценку SLO с течением времени
  • Табличное представление последних 10 оцененных SLO, принадлежащих определенному типу объекта. Переключитесь на табличное представление, чтобы узнать, например, точное значение, которое негативно влияет на результат агрегированной оценки SLO, и связанный с ним объект. Кроме того, вы можете:
    • Сортировать табличное представление по статусу в порядке возрастания или убывания
    • Выберите любой из объектов для получения дополнительной информации на странице соответствующего объекта.

По умолчанию каждый SLO оценивается в соответствии с определенным для него временным интервалом, но для анализа «что, если» с другими временными рамками или для ретроспективного просмотра вы можете временно переключиться на глобальный временной интервал.

Настройка цели уровня обслуживания

Чтобы настроить новую цель уровня обслуживания, используйте мастер SLO, чтобы выбрать из набора предварительно настроенных шаблонов Ключ-АСТРОМ для распространенных случаев использования. Кроме того, вы можете создать свои собственные определения SLO .

Добавление SLO с помощью мастера

В меню Ключ-АСТРОМ перейдите к Целям уровня обслуживания , выберите Добавить новый SLO и выполните действия мастера SLO, как описано ниже.

Выберите свои индикаторы

Определите фильтр

Добавьте критерии успеха

Оценка

Выбор своих индикаторов

  • Выберите нужный SLO:
    • SLO доступности уровня обслуживания, где доступность уровня обслуживания измеряется путем деления количества успешных вызовов службы на общее количество вызовов службы.
    • SLO доступности метода обслуживания, где доступность метода обслуживания измеряется путем деления количества успешных вызовов службы запроса ключа на общее количество вызовов службы запроса ключа.
    • SLO производительности службы , где выражение метрики представляет собой соотношение между goodминутами и totalминутами. Примечание: good минуты подсчитывают количество минут, в течение которых задержка ответа ниже заданного порога.
    • SLO взаимодействия с пользователем , который основан на измерении Apdex и представляет собой процент пользователей, которые УДОВЛЕТВОРЕНЫ , от общего числа пользователей, использующих веб-приложение или мобильное приложение.
    • SLO для мобильных пользователей без сбоев , который измеряет процент пользователей без сбоев в ваших мобильных приложениях.
    • Синтетический SLO доступности, который представляет собой процент успешных синтетических запусков монитора по отношению к общему количеству запусков. Примечание. Дополнительные сведения о вариантах использования см. в разделе Примеры конфигурации определений целей уровня обслуживания .
  • Введите имя SLO .
  • Введите имя метрики , которое будет использоваться для создания двух запросов метрик:
    • Один пользовательский запрос для статуса SLO.
    • Еще один для скорости сжигания бюджета ошибок SLO. Вы можете наметить эти ключи метрик на всех страницах, которые позволяют использовать метрики, например в Проводнике данных . Примечание. После создания SLO:
    • Метрические ключи не могут быть изменены.
    • Вы можете просмотреть ключи метрик в деталях SLO.
  • по желанию Настройте метрики SLI, которые вы хотите добавить в SLO.

Определение фильтра

В селекторе таймфрейма прокрутите вниз, чтобы выбрать значение таймфрейма для вашего SLO.

  • Чтобы выбрать одно из существующих значений, выберите Presets .
  • Чтобы создать собственное значение таймфрейма, выберите « Пользовательский » .

Селектор объектов соответствует синтаксису запросов Ключ-АСТРОМ REST API . Вы можете использовать фильтры по идентификатору/имени зоны управления, тегам, имени/идентификатору/типу объекта, состоянию работоспособности или их комбинации. Для зон управления вы можете выбрать из списка доступных зон управления.

После ввода нужных селекторов объектов вы можете проверить, нет ли ошибок, выбрав Предварительный просмотр рядом с панелью выбора объектов.

Добавление критериев успеха

Установите целевой процент ( Отказ ) и процент предупреждения ( Предупреждение ).

Примечание. Процент предупреждений должен быть между 100 % и вашим целевым процентом SLO, чтобы быть эффективным. Например, если ваш целевой процент SLO составляет 99,00 %, вам необходимо установить процент предупреждений между 99,00 % и 100 %, чтобы получить раннее предупреждение (обозначенное желтым цветом).

Чтобы узнать, насколько быстро служба расходует бюджет ошибок по отношению к SLO, убедитесь, что скорость сжигания бюджета ошибок включена, и установите пороговые значения для скорости медленного и быстрого сжигания .

Оценка

После ввода значений критериев успеха выберите Оценить , чтобы оценить SLO на основе введенных значений.

Если все правильно и ошибок нет, вы можете выбрать «Создать » , чтобы сохранить конфигурацию и добавить новый SLO.

После завершения настройки вновь созданная цель уровня обслуживания появится на странице SLO .

Создание своего собственного SLO

Чтобы настроить собственную цель уровня обслуживания, перейдите в « Настройки » , выберите « Облачная автоматизация » > «Определение » и выберите «Добавить новый SLO » .

Изменение SLO

Чтобы изменить SLO, в меню Ключ-АСТРОМ перейдите к Целям уровня обслуживания , найдите свой SLO и выберите « Дополнительно » ( … ) > « Определение SLO » в столбце « Действия ».

Нормирование бюджета ошибок

Чтобы просмотреть нормализованный бюджет ошибок для всех SLO, выберите « Настройки » > « Облачная автоматизация » > « Настройка » и включите параметр « Нормализация бюджета ошибок » .

Пример. Целевое значение SLO — 95 %, а текущее состояние SLO — 96 %. Если флаг нормализации включен, оставшийся запас ошибки составляет 20% (96%-95%)/(100%-95%).

Скорость расходования бюджета при ошибках

Скорость сжигания бюджета ошибок показывает, насколько быстро служба расходует бюджет ошибок по отношению к SLO. Например,

  • Скорость сжигания 1указывает на то, что служба израсходовала 100 % бюджета ошибок в течение периода SLO.
  • Скорость сжигания 2указывает на то, что сервис израсходовал удвоенный бюджет ошибок в течение периода SLO.

Burn rate рассчитывается либо за прошедший час (если выбран таймфрейм SLO), либо для глобального значения таймфрейма (если таймфрейм SLO не выбран).

Настройка расхода бюджета ошибок

Чтобы узнать, насколько быстро служба расходует бюджет ошибок, вы можете включить визуализацию скорости сжигания в мастере или на странице настроек при создании SLO.

В любое время вы можете изменить пороговое значение или отключить визуализацию скорости сжигания в определении SLO вашего SLO.

Визуализация скорости сжигания бюджета ошибок

После того, как вы настроили скорость сжигания бюджета ошибок, в вашей среде есть несколько мест, где вы можете его просмотреть:

  • На странице обзора SLO в столбце бюджета ошибок:
    • Желтый значок медленного горения отображается, когда значение скорости горения находится между 1порогом быстрого горения, который вы ввели при создании SLO.
    • Красный значок быстрой записи отображается, когда скорость записи больше или равна порогу быстрой записи, введенному вами при создании SLO. Примечание. Если визуализация скорости записи включена, но значок не отображается, скорость записи ниже 1.
  • В деталях SLO.
  • В проводнике данных .
  • На панели инструментов, если вы закрепите SLO на панели инструментов .

Настройка оповещения

Вы можете настроить два типа оповещений:

  • Оповещения SLO отправляются, когда статус SLO становится ниже целевого значения.
  • Оповещения об уровне выгорания отправляются, когда бюджет ошибок SLO уменьшается с определенной скоростью.

Примечание. Оповещения можно создавать только на основе событий метрик за последний час. Если вы установите пороговое значение 10для оповещения о скорости сжигания, предупреждение будет сгенерировано, когда скорость сжигания превысит 10в течение последнего часа.

  • Чтобы настроить оповещение SLO
  1. Перейдите к Целям уровня обслуживания , найдите SLO и выберите Дополнительно ( … ) > Создать оповещение .
  2. В поле Выберите тип оповещения выберите Status.
  3. Назовите свое оповещение и установите пороговое значение. Если вы не зададите значение, пороговое значение будет заполнено существующим целевым значением SLO.
  4. Выберите Создать оповещение .
  • Чтобы настроить оповещение о скорости сжигания
  1. Перейдите к Целям уровня обслуживания , найдите SLO и выберите Дополнительно ( … ) > Создать оповещение .
  2. В поле Выберите тип оповещения выберите Burn rate.
  3. Назовите свое оповещение и установите порог скорости сжигания.
  4. Выберите Создать оповещение .

Ваше вновь созданное оповещение о SLO или скорости сжигания появится на странице Metric Events , где вы сможете настроить его дальше. Дополнительные сведения см. в разделе События метрик для оповещения .

Добавление SLO в зоны управления

SLO, не принадлежащие ни к одной из зон управления , видны всем пользователям. Если вы добавите SLO в зону управления, только пользователи, имеющие доступ к этой зоне управления, смогут увидеть его на странице обзора целей уровня обслуживания .

  • Чтобы добавить SLO в зону управления
  1. В меню Ключ-АСТРОМ перейдите в « Настройки » .
  2. Выберите «Облачная автоматизация » > «Определение » .
  3. Выберите Добавить новый SLO .
  4. В поле выбора объектов добавьте имя или идентификатор зоны управления .
  5. После ввода всех данных SLO выберите Сохранить изменения , чтобы сохранить конфигурацию.
  • Чтобы добавить существующий SLO в зону управления, см . раздел Редактирование SLO .
  • Чтобы просмотреть SLO, принадлежащие определенной зоне управления, выберите зону управления с помощью кнопки фильтра в строке меню.
  • Чтобы просматривать глобальные SLO независимо от любого другого выбранного фильтра зоны управления, включите Показать глобальные SLO . Глобальные SLO — это SLO, которые видны всем пользователям, независимо от их разрешений в зоне управления.

Дополнительные сведения о том, как вы можете контролировать доступ к SLO в своей среде, устанавливая разрешения, см. в разделе Просмотр и изменение SLO на основе уровней разрешений .

Закрепление SLO на панели инструментов

После того, как вы определите свои цели, вы можете добавить SLO на свою панель инструментов, чтобы визуализировать их текущий статус вместе с оставшимися бюджетами ошибок.

  1. В меню Ключ-АСТРОМ перейдите к Цели уровня обслуживания , найдите свой SLO и выберите « Дополнительно » ( … ) > « Закрепить на панели инструментов » в столбце « Действия ».
  2. В списке выберите существующую панель мониторинга или Создать новую панель мониторинга , а затем выберите Закрепить .
  3. Выберите Открыть информационную панель , чтобы открыть информационную панель в режиме редактирования с выбранной плиткой SLO.
  4. При необходимости отрегулируйте конфигурацию плитки.
  5. Выберите Готово .

По умолчанию плитка SLO оценивает временной интервал SLO, а не выбранный глобальный временной интервал, который отображается маленьким значком фильтра в правом верхнем углу плитки SLO. Для сравнения глобального таймфрейма и таймфрейма SLO можно также переопределить таймфрейм, используемый в конфигурации плитки.

Дополнительные сведения см. в разделе Просмотр и добавление плиток панели мониторинга SLO на основе уровней разрешений .

Клонирование SLO

Клонирование SLO позволяет создать новый SLO, повторно используя конфигурацию существующего SLO.

Чтобы клонировать SLO

  1. В меню Ключ-АСТРОМ перейдите к Целям уровня обслуживания .
  2. Выберите SLO, который вы хотите клонировать, а затем выберите «Действие» > « Клонировать » . Страница « Добавить новый SLO » предварительно заполнена настройками клонированного SLO.
  3. При необходимости измените параметры нового SLO, а затем выберите « Создать » .

Отображение метрики в проводнике данных

Чтобы запросить и составить диаграмму показателей, перейдите к нужной цели уровня обслуживания и выберите Действия > Просмотреть в проводнике данных . Дополнительные сведения об использовании проводника данных см. в разделе Проводник данных .

Ограничения

  • Проводник данных показывает ключи метрик; он не показывает преобразования или фильтры.

Оповещение Дэвиса

Ключ-АСТРОМ ИИ предоставляет быстрые уведомления об обнаруженных аномалиях, а также о возможных основных причинах. Если ваш SLO стал красным, это, скорее всего, потому, что Дэвис уже поднял проблему для основных показателей, показав вам основную причину.

Примечание. ИИ выдает оповещения не о нарушениях целевых показателей SLO, а о базовых метриках и объектах SLO.

Устранение неполадок

Мой список SLO загружается очень долго

Вычисление SLO зависит от запросов метрик в реальном времени, поэтому фильтр, используемый для SLO, имеет решающее значение для производительности вычислений. Если ваш список SLO очень медленный, проверьте фильтры сущностей для определенных вами SLO.

Требуется одно результирующее значение, но определение SLO предоставляет более одного

Вы, вероятно, отсутствует:splitBy() в своем метрическом выражении.

Временной интервал начинается до создания метрики

Вам нужно выбрать таймфрейм, который начинается после времени создания метрики.

Зона управления не выбрана

Пользователи без глобального writeразрешения не могут создавать SLO без зоны управления.