Режимы мониторинга инфраструктуры и обнаружения

Материал из Документация Ключ-АСТРОМ
Версия от 20:07, 19 января 2025; IKuznetsov (обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Применение Ключ-АСТРОМ / Хосты / Режимы мониторинга инфраструктуры и обнаружения

Если вам не нужно, чтобы ЕдиныйАгент работал в режиме мониторинга полного стека, вы также можете использовать один из двух облегченных режимов, которые предоставляют вам подмножество показателей ЕдиногоАгента, фокусируясь на инфраструктуре вашего хоста:

  • Режим мониторинга инфраструктуры
  • Режим обнаружения

В таблице ниже представлен обзор доступных параметров мониторинга для каждого из режимов мониторинга.

Обнаружение Инфраструктура Фулл стек
Обнаружение топологии (обнаружение гибридного облака)
Критичность хоста (обнаружение внешних служб и зависимостей приложений)
Базовый мониторинг (состояние хоста, мониторинг файловой системы, мониторинг служб ОС)
Подробности процесса хоста
Подробный анализ диска
Сетевой анализ
Анализ памяти
Расширения opt-in opt-in
Пользовательские метрики 100 / хост 15 / 256 МБ
Управление логами opt-in opt-in opt-in
Отслеживание и профилирование
Внедрение процессов opt-out
Безопасность приложений opt-in opt-in opt-in

Дополнительную информацию о режимах мониторинга инфраструктуры и обнаружения для безопасности приложений см. в разделе Безопасность приложений и режимы мониторинга.

Режим мониторинга по умолчанию

Вы можете определить режим мониторинга по умолчанию перед установкой ЕдиногоАгента. Это изменит режим мониторинга Full-Stack по умолчанию на странице развертывания ЕдиногоАгента (для операционных систем Linux, Windows и AIX) и в приложении Discovery & Coverage (при развертывании ЕдиногоАгента со страницы установки ЕдиногоАгента).

Чтобы определить режим мониторинга по умолчанию

  1. Перейдите в Настройки > Предпочтения > Версия ЕдиногоАгента по умолчанию.
  2. Выберите режим версионирования ЕдиногоАгента по умолчанию из раскрывающегося списка.
  3. Выберите Сохранить изменения .

Выбранное значение будет установлено как значение по умолчанию для выбранного режима развертывания ЕдиногоАгента.

Режим обнаружения

ЕдиныйАгент версии 1.281+

Режим обнаружения ЕдиногоАгента предоставляет базовые метрики, позволяющие вам обнаруживать хосты и процессы, а также изучать потенциал для расширения вашего мониторинга.

Мы рекомендуем вам развернуть ЕдиныйАгент в режиме Full-Stack Monitoring для мониторинга критически важных для бизнеса приложений. Аналогично мы рекомендуем вам отслеживать критически важную инфраструктуру, например, базы данных, очереди и системы обмена сообщениями с помощью Infrastructure Monitoring. ЕдиныйАгент в режиме Discovery (Обнаружение) можно развернуть по всей оставшейся части вашей инфраструктуры для полной видимости благодаря его относительно низкой стоимости.

Режим Discovery (Обнаружение) доступен только при использовании модели подписки на платформу Ключ-АСТРОМ. Потребление лицензии осуществляется через возможности Foundation & Discovery.

Чтобы узнать больше, см. раздел Мониторинг хоста с помощью Ключ-АСТРОМ.

В режиме Discovery (Обнаружение) доступны следующие встроенные метрики:

Процессор

Ключ метрики Название и описание Еденица измерения Агрегация
builtin:host.cpu.entConfig Настройка прав AIX

Capacity Entitlement — это количество виртуальных процессоров, назначенных разделу AIX. Измеряется в долях процессора, равных 0,1 или 0,01. Для получения дополнительной информации о entitlement см. Assigning the appropriate processor titled capacity

Ratio auto

avg

max

min

builtin:host.cpu.entc Использование прав AIX

Процент использования полномочий. Capacity Entitlement — это количество виртуальных ядер, назначенных разделу AIX.

Для получения дополнительной информации о полномочиях см. Assigning the appropriate processor entitled capacity

Percent (%) auto

avg

max

min

builtin:host.cpu.idle Процессор в режиме ожидания

Среднее время процессора в режиме ожидания (простоя)

Percent (%) auto

avg

max

min

builtin:host.cpu.iowait Ожидание ввода-вывода ЦП

Процент времени простоя ЦП, в течение которого у системы был невыполненный запрос ввода-вывода. Недоступно в Windows.

Percent (%) auto

avg

max

min

builtin:host.cpu.load Нагрузка на систему

Среднее количество процессов, которые выполняются ЦП или ожидают выполнения ЦП за последнюю минуту.

Ratio auto

avg

max

min

builtin:host.cpu.load15m Нагрузка системы 15 мин

Среднее количество процессов, которые выполняются ЦП или ожидают выполнения ЦП за последние 15 минут.

Ratio auto

avg

max

min

builtin:host.cpu.load5m Нагрузка системы 5 мин

Среднее количество процессов, которые выполняются ЦП или ожидают выполнения ЦП за последние 5 минут.

Ratio auto

avg

max

min

builtin:host.cpu.other ЦП другое

Среднее время ЦП, затрачиваемое на другие задачи: обслуживание запросов на прерывание (IRQ), запуск виртуальных машин под управлением ядра хоста (это означает, что хост является гипервизором для ВМ). Доступно только для хостов Linux

Percent (%) auto

avg

max

min

builtin:host.cpu.physc Физическое потребление AIX

Общее количество процессоров, потребляемых разделом AIX

Ratio auto

avg

max

min

builtin:host.cpu.steal Заимствование ЦП

Среднее время ЦП, когда виртуальная машина ждет, чтобы получить циклы ЦП от гипервизора. В виртуальной среде циклы ЦП распределяются между виртуальными машинами на сервере гипервизора. Если ваш виртуализированный хост показывает высокий уровень заимствования ЦП, это означает, что циклы ЦП забираются у вашей виртуальной машины для обслуживания других целей. Это может указывать на перегруженный гипервизор. Он доступен только для хостов Linux

Percent (%) auto

avg

max

min

builtin:host.cpu.system ЦП системы

Среднее время работы ЦП, когда ЦП работал в режиме ядра

Percent (%) auto

avg

max

min

builtin:host.cpu.usage % использования ЦП

Процент времени ЦП, когда ЦП был использован. Значение, близкое к 100%, означает, что большинство ресурсов обработки хоста используются, и ЦП хоста не могут справиться с дополнительной работой

Percent (%) auto

avg

max

min

builtin:host.cpu.user ЦП пользователя

Среднее время работы ЦП, когда ЦП работал в пользовательском режиме

Percent (%) auto

avg

max

min

builtin:host.kernelThreads.blocked Заблокированные потоки ядра AIX

Длина очереди подкачки. Очередь подкачки содержит потоки, готовые к запуску, но замененные текущими запущенными потоками.

Count auto

avg

max

min

builtin:host.kernelThreads.ioEventWait Ожидание события ввода-вывода потоков ядра AIX

Количество потоков, ожидающих прямого доступа к файловой системе (cio) + Количество процессов, которые спят в ожидании буферизованного ввода-вывода

Count auto

avg

max

min

builtin:host.kernelThreads.ioMessageWait Ожидание сообщений ввода-вывода потоков ядра AIX

Количество потоков, которые спят и ждут необработанных операций ввода-вывода в определенное время. Необработанная операция ввода-вывода позволяет приложениям напрямую записывать на уровень диспетчера логических томов (LVM)

Count auto

avg

max

min

builtin:host.kernelThreads.running Потоки ядра AIX готовых к запуску

Количество готовых к запуску потоков (работающих или ожидающих времени выполнения) (готовых потоков). Среднее количество готовых к запуску потоков отображается в первом столбце вывода команды vmstat

Count auto

avg

max

min

Память

Ключ метрики Название и описание Еденица измерения Агрегация
builtin:host.mem.avail.bytes Доступная память

Объем памяти (RAM), доступный на хосте. Память, доступная для выделения новым или существующим процессам. Доступная память — это оценка того, сколько памяти доступно для использования без подкачки.

Byte auto

avg

max

min

builtin:host.mem.avail.pct Доступная память %

Процент памяти (RAM), доступной на хосте. Память, доступная для выделения новым или существующим процессам. Доступная память — это оценка того, сколько памяти доступно для использования без подкачки. Показывает доступную память в процентах.

Percent (%) auto

avg

max

min

builtin:host.mem.kernel Память ядра

Память, используемая ядром системы. Она включает память, используемую основными компонентами ОС, а также драйверами устройств. Обычно это число будет очень небольшим.

Byte auto

avg

max

min

builtin:host.mem.recl Восстанавливаемая память

Использование памяти для определенных целей. Восстанавливаемая память рассчитывается как доступная память (оценка того, сколько памяти доступно для использования без подкачки) минус свободная память (объем памяти, которая в данный момент не используется).

Byte auto

avg

max

min

builtin:host.mem.total Общий объем памяти

Объем памяти (ОЗУ), установленной в системе.

Byte auto

value

builtin:host.mem.usage Использование памяти %

Показывает процент используемой в данный момент памяти. Используемая память рассчитывается ЕдинымАгентом следующим образом: используемая = общая – доступная. Таким образом, метрика используемой памяти, отображаемая в представлениях анализа Ключ-АСТРОМ, не равна метрике используемой памяти, отображаемой системными инструментами. В то же время важно помнить, что системные инструменты сообщают об используемой памяти, и что этот конкретный метод расчета используемой памяти на самом деле не отражает того, как ядро ​​Linux управляет памятью в современных системах. Разница в этих измерениях на самом деле также довольно существенна.

Примечание: рассчитывается путем взятия 100% - "Доступная память %".

Percent (%) auto

avg

max

min

builtin:host.mem.used Использование памяти

Используемая память рассчитывается ЕдинымАгентом следующим образом: используемая = общая – доступная. Таким образом, метрика используемой памяти, отображаемая в представлениях анализа Ключ-АСТРОМ, не равна метрике используемой памяти, отображаемой системными инструментами. В то же время важно помнить, что системные инструменты сообщают об используемой памяти, и что этот конкретный метод расчета используемой памяти на самом деле не отражает того, как ядро ​​Linux управляет памятью в современных системах. Разница в этих измерениях на самом деле также довольно существенна.

Byte auto

avg

max

min

Доступность

Ключ метрики Название и описание Еденица измерения Агрегация
builtin:host.availability.state Доступность хоста

Метрика состояния доступности хоста сообщается с интервалом в 1 минуту

Count auto

value

builtin:host.uptime Время безотказной работы хоста

Время с момента последней загрузки хоста. Требуется ЕдиныйАгент 1.259+. Метрика не поддерживается для развертываний ЕдиногоАгента только для приложений.

Second auto

avg

max

min

Диск

Ключ метрики Название и описание Еденица измерения Агрегация
builtin:host.disk.avail Доступность диска

Количество свободного места, доступного пользователю в файловой системе. В Linux и AIX это свободное место, доступное непривилегированному пользователю. Оно не содержит часть свободного места, зарезервированного для root.

Byte auto

avg

max

min

builtin:host.disk.free Доступность диска %

Процент свободного места, доступного пользователю в файловой системе. В Linux и AIX это % свободного места, доступного непривилегированному пользователю. Он не содержит часть свободного места, зарезервированного для root.

Percent (%) auto

avg

max

min

builtin:host.disk.used Использование диска

Объем используемого пространства в файловой системе

Byte auto

avg

max

min

Сеть

Ключ метрики Название и описание Еденица измерения Агрегация
builtin:host.net.nic.bytesRx Получено байтов NIC

Байты сетевого интерфейса, полученные на хосте

Byte/second auto

avg

max

min

builtin:host.net.nic.bytesTx Байты NIC, отправленные на хост

Байты сетевого интерфейса, отправленные на хост

Byte/second auto

avg

max

min

builtin:host.net.nic.linkUtilRx Использование приемного канала NIC

Использование сетевого интерфейса для приема канала на хосте

Percent (%) auto

avg

max

min

builtin:host.net.nic.linkUtilTx Использование канала передачи NIC

Использование канала передачи сетевого интерфейса на хосте

Percent (%) auto

avg

max

min

Включить режим обнаружения

Режим обнаружения включается на уровне хоста либо во время установки ЕдиногоАгента, либо после нее.

Чтобы включить режим Discovery (обнаружения) во время установки ЕдиногоАгента, используйте параметр --set-monitoring-mode=discovery.

Дополнительную информацию см. в документации по установке ЕдиногоАгента, соответствующей вашей среде.

Чтобы включить режим Discovery (обнаружения) после установки ЕдиногоАгента, используйте один из следующих вариантов:

  • В Ключ-АСТРОМ
    1. Перейдите в раздел Хосты и откройте страницу обзора хостов.
    2. Выберите Дополнительно ( … ) > Настройки в правом верхнем углу, чтобы открыть страницу настроек хоста .
    3. Выберите Мониторинг хостов.
    4. Перейдите в Режим мониторинга и в раскрывающемся меню выберите соответствующий пункт.
    5. Выберите Сохранить изменения .
  • Для настройки параметра используйте интерфейс командной строки ЕдиногоАгента --set-monitoring-mode=discovery.

Вставка кода-модуля

Для работы Application Security в режиме Discovery (обнаружения) требуется внедрение code-module. По умолчанию внедрение code-module отключено.

После включения режима Discovery (обнаружения) вы можете включить внедрение кода-модуля для одного хоста.

  1. Перейдите на страницу настроек нужного хоста и выберите Мониторинг хостов.
  2. Перейдите в Дополнительные настройки.
  3. Включите CodeModule Injection , затем выберите Сохранить изменения .
  4. Перезапустите контролируемые процессы на хосте.

Режим мониторинга инфраструктуры

Автоматическое внедрение ЕдиногоАгента

1002.png ЕдиныйАгент в режиме мониторинга инфраструктуры автоматически внедряется в процессы, чтобы иметь возможность отслеживать службы поддержки, написанные на Java, и метрики времени выполнения для поддерживаемых языков.

В то время как режим Full-Stack обеспечивает полный мониторинг производительности приложений, видимость на уровне кода, глубокий мониторинг процессов и мониторинг инфраструктуры (включая платформы PaaS) для случаев использования, где требуется меньшая видимость, ЕдиныйАгент можно настроить для режима мониторинга инфраструктуры, который обеспечивает мониторинг физической и виртуальной инфраструктуры, а также мониторинг логов и AIOps.

Включить режим мониторинга инфраструктуры

Режим мониторинга инфраструктуры включается на уровне хоста либо во время установки ЕдиногоАгента, либо после нее.

OneAgent версии 1.273+ Команда --set-infra-only теперь устарела. Используйте вместо нее команду --set-monitoring-mode.

Во время установки ЕдиногоАгента :

Чтобы включить режим мониторинга инфраструктуры во время установки ЕдиногоАгента, используйте параметр --set-monitoring-mode=infra-only.

Дополнительную информацию см. в документации по установке ЕдиногоАгента, соответствующей вашей среде.

После установки ЕдиногоАгента :

Чтобы включить режим мониторинга инфраструктуры после установки ЕдиногоАгента, используйте один из следующих вариантов:

  • В Ключ-АСТРОМ
    1. Перейдите в раздел Хосты и откройте страницу обзора хостов.
    2. Выберите Дополнительно ( … ) > Настройки в правом верхнем углу, чтобы открыть страницу настроек хоста .
    3. Выберите Мониторинг хостов.
    4. Перейдите в Режим мониторинга и в раскрывающемся меню выберите соответствующий пункт.
    5. Выберите Сохранить изменения .
  • Для настройки параметра используйте интерфейс командной строки ЕдиногоАгента --set-monitoring-mode=infra-only .
  • Используйте API настроек для включения режима мониторинга инфраструктуры в нужном масштабе.
  • Чтобы загрузить схему, используйте метод GET схемы , указав builtin:host.monitoring в качестве schemaId, и создайте объект конфигурации, используя метод POST объекта .

Внедрение процесса

Внедрение процесса предоставляет вам дополнительные данные для мониторинга инфраструктуры. Внедрение процесса включено по умолчанию.

Если вы запустите ЕдиныйАгент как контейнер с включенным режимом мониторинга инфраструктуры, внедрение процесса не будет выполнено.

Режим мониторинга инфраструктуры позволяет вам контролировать любой компонент инфраструктуры и службу поддержки, написанную на Java. Вы можете контролировать службы поддержки, поддерживаемые по умолчанию (например, Kafka или ActiveMQ), а также можете создавать собственные расширения JMX и PMI для компонентов инфраструктуры и использовать их в режиме мониторинга инфраструктуры.

Кроме того, при внедрении процесса режим мониторинга инфраструктуры предоставляет метрики времени выполнения для:

  • Java
  • .NET
  • Node.js
  • Golang
  • PHP
  • Веб-серверы, такие как Apache HTTP, NGINX или Microsoft IIS.

Отключение автоматического внедрения процесса

Мы не рекомендуем отключать автоматическое внедрение, но если это необходимо из-за строгих требований безопасности, вы можете выбрать один из нескольких вариантов. Отключение автоматического внедрения также не позволяет Ключ-АСТРОМ обнаруживать уязвимости в вашей среде, даже если вы включите Application Security . Вы можете отключить автоматическую инъекцию на уровне хоста или среды.

Отключить автоматическое внедрение для одного хоста

После установки ЕдиногоАгента с пользовательским интерфейсом

  1. Перейдите в раздел Хосты и откройте страницу обзора хостов.
  2. Выберите Дополнительно ( … ) > Настройки в правом верхнем углу, чтобы открыть страницу настроек хоста .
  3. Выберите Мониторинг хостов .
  4. Перейдите в Дополнительные настройки .
  5. Отключите Автоматическое внедрение , затем выберите Сохранить изменения .
  6. Перезапустите контролируемые процессы на хосте.

Для настройки параметра используйте интерфейс командной строки ЕдиногоАгента --set-auto-injection-enabled=false .

Отключить автоматическое внедрение для среды

Определить пользовательские правила мониторинга процессов

Вы можете отключить внедрение процессов для определенных групп процессов, используя пользовательские правила мониторинга процессов.

Правила мониторинга пользовательских процессов дают вам детальный контроль над тем, в какие процессы внедряется ЕдиныйАгент, с подходом, который легко масштабируется в больших средах. Вам не нужно настраивать конфигурацию системы, а несколько правил могут охватывать тысячи процессов.

Отключить метрики времени выполнения

Вы можете отключить сбор метрик JMX/PMI и времени выполнения, что приведет к отключению автоматического внедрения в режиме мониторинга инфраструктуры.

  1. Перейдите в Настройки > Мониторинг > Отслеживаемые технологии .
  2. В списке поддерживаемых технологий найдите запись Метрики времени выполнения Java / .NET / Node.js / Golang / PHP + метрики WebServer в режиме инфраструктуры .
  3. Выберите значок карандаша , чтобы отредактировать его, а затем отключите его.
  4. Перезапустите все процессы на хостах, контролируемых вашей инфраструктурой.

Вы также можете отключить выбранные расширения, собирающие метрики на уровне среды.

  1. Перейдите в Настройки > Мониторинг > Отслеживаемые технологии .
  2. Поддерживаемые технологии
    1. В списке поддерживаемых технологий найдите технологии, отмеченные как JMX-мониторинг в столбце Тип .
    2. Выберите значок карандаша , чтобы отредактировать расширение по вашему выбору.
    3. Отключите функцию Мониторинг среды для хостов в режиме мониторинга только инфраструктуры .
  3. Пользовательские расширения
    1. В списке пользовательских расширений найдите расширения, отмеченные как JMX или PMI в столбце Тип расширения .
    2. Выберите имя расширения по вашему выбору.
    3. Отключите функцию Мониторинг среды для хостов в режиме мониторинга только инфраструктуры . Настройка на уровне хоста имеет приоритет над настройками среды. Если хост настроен на Use host configuration for the extension и расширение не активировано на этом хосте, конфигурация среды не будет применена. Чтобы убедиться, что расширение активно на уровне одного хоста:
    4. Перейдите в Хосты и найдите хост с мониторингом инфраструктуры. Вы можете отфильтровать по режиму мониторинга: Infrastructure only .
    5. Откройте страницу хоста.
    6. Выберите Дополнительно ( … ) > Настройки в правом верхнем углу, чтобы открыть страницу настроек хоста .
    7. В таблице Отслеживаемые технологии найдите расширения типа JMX extension , JMX monitoring или PMI extension .
    8. Выберите Изменить . Используйте элемент управления Активировать <extension name> на этом хосте .

Фильтрация хостов по статусу внедрения

При отключении автоматического внедрения вы можете найти такие хосты с помощью фильтра автоматического внедрения на странице состояния развертывания или ЕдиногоАгента на API хоста .

Фильтрацию можно осуществить следующими способами :

  1. Через веб интерфейс Ключ-АСТРОМ (раздел Состояние ЕдиногоАгента)
  2. Через API-интерфейс Ключ-АСТРОМ (параметр autoInjection установленный на DISABLED_MANUAL)