Основы целей уровня обслуживания (SLO)
Ключ-АСТРОМ предоставляет всю необходимую информацию в режиме реального времени, которая требуется вашим группам по проектированию надежности объекта (SRE) для отслеживания поставленных целей.
Команда SRE отвечает за поиск хороших показателей уровня обслуживания (SLI) для заданной услуги, чтобы внимательно следить за надежной доставкой этой услуги. SLI могут отличаться от одной услуги к другой, поскольку не все услуги одинаково критичны с точки зрения ограничений по времени и ошибкам.
Ключ-АСТРОМ предлагает более 2000 различных метрик, которые готовы к использованию в качестве выделенных SLI.
После того, как команда SRE выбрала набор показателей, остается определить и контролировать операционную цель в рамках цели уровня обслуживания (SLO).
Обычно SLO состоит из следующих основных данных:
- Индикатор уровня обслуживания (SLI) : индикатор, используемый для измерения успешности предоставления услуг. SLI обычно относятся к таким показателям, как уровень успешности обслуживания, количество пользователей мобильных приложений без сбоев, успешные запуски синтетических тестов или время отклика.
- Цель : Цель определяет запланированную цель, которую необходимо достичь с точки зрения предоставления услуг. Целью может быть, например, то, что 99,99% всех вызовов на обслуживание должны возвращаться без ошибок или что 95% всех запросов на обслуживание должны быть выполнены менее чем за 2 секунды.
- Период оценки : Период оценки необходим для стандартизации коммуникации относительно результата SLO. Без определенного периода оценки понятия доступности являются субъективными.
Каждое определение SLO можно оценить по следующим показателям:
- Статус SLO : Текущий результат оценки SLO, выраженный в процентах. Семантика этого процента (например, 99,3% всех запросов на обслуживание успешны или 99,99% всех пользователей веб-сайта «удовлетворены» с точки зрения рейтинга Apdex) и целевой показатель, определенный для этого процента, определяются командой SRE. Статус SLO должен быть нормализован по процентному значению в диапазоне 0–100%.
- Буфер ошибок SLO : Оставшийся буфер до тех пор, пока заданная цель SLO не будет считаться невыполненной. Например, если SLO определяет цель 95%, а ее текущий статус SLO оценивается как 98%, оставшийся буфер ошибок — это разница между статусом SLO и целью SLO.
Дополнительную информацию о нормализованном буфере ошибок SLO и скорости сжигания буфера ошибок SLO см. в разделе Настройка и мониторинг Целей уровня обслуживания (SLO) с помощью Ключ-АСТРОМ.