Мониторинг хоста с помощью Ключ-АСТРОМ: различия между версиями

Материал из Документация Ключ-АСТРОМ
Строка 1: Строка 1:
'''''[[Применение Ключ-АСТРОМ]] / [[Применение Ключ-АСТРОМ#.D0.A5.D0.BE.D1.81.D1.82.D1.8B|Хосты]] / Мониторинг / Мониторинг хоста с помощью Ключ-АСТРОМ'''''
'''''[[Применение Ключ-АСТРОМ]] / [[Применение Ключ-АСТРОМ#.D0.A5.D0.BE.D1.81.D1.82.D1.8B|Хосты]] / Мониторинг / Мониторинг хоста с помощью Ключ-АСТРОМ'''''


Мы изменили дизайн страницы обзора хоста.
Как только данные о хостах собраны, ИИ мгновенно начинает базовую оценку данных. Каждая метрика, отображаемая на странице обзора хоста, является частью исходных данных ИИ, используемых для автоматического выявления потенциальных проблем производительности на уровне инфраструктуры или полного стека.


* В этой документации описывается новый дизайн.
Как добраться:
* Если вы хотите вернуться к классической главной странице, включите переключатель Вернуться к классической странице на странице Добро пожаловать на новую страницу! сообщение на новой главной странице, а затем обратитесь к документации по классической главной странице .


Как только данные о хостах будут собраны, Ключ-АСТРОМ ИИ сразу же приступит к базовому анализу данных. Каждая метрика, отображаемая на странице обзора хоста, является частью исходных данных ИИ, используемых для автоматического выявления потенциальных проблем с производительностью на уровне инфраструктуры или всего стека.
# Перейдите в раздел '''Хосты''' (последняя версия Ключ-АСТРОМ), чтобы получить список всех хостов (физических или виртуальных) в вашей среде, на которых установлен ЕдиныйАгент.
 
Как туда добраться:
 
# В меню Ключ-АСТРОМ перейдите в раздел Хосты , чтобы просмотреть список всех хостов (физических или виртуальных) в вашей среде, на которых установлен ЕдиныйАгент.
# Выберите имя хоста в списке, чтобы перейти на страницу обзора этого хоста.
# Выберите имя хоста в списке, чтобы перейти на страницу обзора этого хоста.


Все соответствующие метрики хоста отображаются на одной странице, которая разделена на несколько логических разделов.
Все соответствующие показатели хоста отображаются на одной странице, которая разделена на несколько логических разделов.
 
=== Панель уведомлений ===
Панель уведомлений хоста дает вам краткий обзор состояния хоста. Выберите элемент уведомления, чтобы отобразить дополнительную информацию.


* Свойства и теги
== Панель уведомлений ==
* Проблемы
Панель уведомлений хоста дает вам быстрый обзор состояния хоста. Выберите элемент уведомления, чтобы отобразить больше информации.
* Уязвимости
* Доступность


=== Свойства и теги ===
=== Свойства и теги ===
Выберите « Свойства и теги » на панели уведомлений, чтобы отобразить панель « Свойства и теги », на которой отображаются метаданные о выбранном хосте:
Выберите '''Свойства и теги''' на панели уведомлений, чтобы отобразить панель '''Свойства и теги''', на которой отображаются метаданные о выбранном хосте:


* Теги перечисляют теги, которые в настоящее время применяются к хосту. Выберите Добавить тег , чтобы добавить тег в метаданные хоста.
* '''Теги''' перечисляют теги, которые в настоящее время применяются к хосту. Выберите Добавить тег , чтобы добавить тег к метаданным хоста.
* В свойствах перечислены различные свойства хоста, такие как версия ЕдиныйАгент, версия ОС, режим мониторинга, IP-адреса и зоны управления.
* В разделе '''Свойства''' перечислены различные свойства хоста, такие как версия ЕдиныйАгент, версия ОС, режим мониторинга, IP-адреса и зоны управления.


=== Проблемы ===
=== Проблемы ===


* На панели уведомлений Проблемы указывают активные и закрытые проблемы, связанные с выбранным хостом.
* На панели уведомлений в разделе '''Проблемы''' отображаются активные и закрытые проблемы, связанные с выбранным хостом.
* Выберите « Проблемы » на панели уведомлений, чтобы отобразить панель « Проблемы », на которой перечислены проблемы.
* Выберите '''Проблемы''' на панели уведомлений, чтобы отобразить панель '''Проблемы''', на которой перечислены проблемы.
** Выберите проблему, чтобы отобразить подробности.
** Выберите проблему для отображения подробностей.
** Выберите «Перейти к проблемам» , чтобы перейти на страницу « Проблемы », отфильтрованную по выбранному хосту.
** Выберите '''Перейти в проблемы''' , чтобы перейти на страницу проблем , отсортированную по выбранному хосту.


=== Уязвимости ===
=== Уязвимости ===


* На панели уведомлений Уязвимости указывают наиболее часто обнаруженные уязвимости , затрагивающие выбранный узел.
* На панели уведомлений в разделе '''Уязвимости''' отображаются наиболее часто обнаруженные уязвимости, влияющие на выбранный хост.
* Выберите Уязвимости на панели уведомлений, чтобы отобразить панель Уязвимости , на которой перечислены наиболее серьезные сторонние уязвимости и уязвимости на уровне кода, связанные с этим хостом.
* Выберите '''Уязвимости''' на панели уведомлений, чтобы отобразить панель '''Уязвимости''' , на которой перечислены наиболее серьезные сторонние уязвимости и уязвимости на уровне кода, связанные с этим хостом.
** Выберите уязвимость в списке, чтобы просмотреть подробности и понять серьезность и влияние уязвимости в вашей среде.
** Выберите уязвимость в списке, чтобы просмотреть подробную информацию и понять серьезность и влияние уязвимости в вашей среде.
** Чтобы просмотреть полный список обнаруженных уязвимостей, затрагивающих этот хост, выберите Показать все сторонние уязвимости / Показать все уязвимости на уровне кода Пример сторонних уязвимостей:  Примеры уязвимостей на уровне кода:
** Для получения полного списка обнаруженных уязвимостей, влияющих на этот хост, выберите '''Вид all third-party уязвимости''' / '''Вид other code-level уязвимости''' снизу вкладок '''Сторонние уязвимости / Уязвимости в коде'''Примеры уязвимостей:  [[Файл:1001.png|граница|521x521пкс]]  [[Файл:1002.png|граница|21x21пкс]] Если у вас отсутствуют разрешения безопасности для выбранной зоны управления, на вкладке '''Уязвимости''' на панели уведомлений отобразится <code>Not analyzed</code>.


=== Доступность ===
=== Доступность ===


* На панели уведомлений Доступность указывает процент времени, в течение которого узел был в сети и отвечал на запросы. Ключ-АСТРОМ обнаруживает и показывает отключения операционной системы (включая перезагрузки) и периоды, когда хост находится в автономном режиме (например, если хост неожиданно отключился).
* На панели уведомлений '''Доступность''' показывает процент времени, в течение которого хост был в сети и отвечал на запросы. Ключ-АСТРОМ обнаруживает и показывает выключения операционной системы (включая перезагрузки) и периоды, когда хост находится в автономном режиме (например, если хост неожиданно отключается).
* Выберите « Доступность » на панели уведомлений, чтобы отобразить панель « Доступность хоста », на которой отображается доступность хоста с течением времени.
 
Выберите '''Доступность''' на панели уведомлений, чтобы отобразить панель '''Доступность хоста''', на которой отображается доступность хоста с течением времени.
 
[[Файл:1003.png|граница|679x679пкс]]
 
=== SLO ===
 
* На панели уведомлений '''SLO''' отображает текущее количество '''SLO''', относящихся к выбранному хосту.
* Выберите '''SLO''' на панели уведомлений, чтобы отобразить панель целей уровня обслуживания , в которой перечислены '''SLO''', напрямую или косвенно подключенные к хосту.
 
==== SLO подключенные напрямую ====
 
* '''SLO''' напрямую подключается к хосту, когда селектор сущностей '''SLO''' соответствует следующим критериям:
** Тип сущности установлен на <code>"HOST"</code>.
** Идентификатор сущности устанавливается равным идентификатору хоста.
* Чтобы увидеть только '''SLO''', напрямую подключенные к хосту, убедитесь, что включен параметр '''Показывать только напрямую связанные SLO''' .
 
==== Косвенно подключенные SLO ====
 
* '''SLO''' не подключается напрямую к хосту, если в селекторе сущностей '''SLO''' не указан идентификатор сущности.  Пример: Если указаны общие значения, такие как <code>type("HOST"),tag("slo")</code>, запрос возвращает все '''SLO''' для всех хостов, включая текущий хост.
* Чтобы увидеть '''SLO''', которые не подключены напрямую к хосту, отключите параметр '''Показывать только напрямую связанные SLO'''.
 
==== Параметры ====
 
* Выберите '''Детали''' , чтобы просмотреть диаграмму соответствующих показателей SLO.
* В разделе '''Действия''' выберите
** Чтобы увидеть показатели '''SLO''' в '''Визуализации Метрик''', откройте его .
** '''Закрепить на дашборде''' , чтобы закрепить '''SLO''' на дашборде . Подробности см. в разделе [[Закрепление плиток на панели инструментов|'''<u>''Закрепление плиток на панели инструментов''</u>''']].
** '''SLO определения''' для редактирования '''SLO''' в определениях целей уровня обслуживания .
** '''Клонировать''' для клонирования '''SLO''' .
** '''Создать оповещение''' , чтобы создать оповещение для '''SLO''' .
 
==== Нет SLO ====
Если '''SLO''' не найдены, вы можете
 
* Выберите другой таймфрейм в правом верхнем углу.  [[Файл:1004.png|граница]]
* Выберите '''Добавить SLO''' , чтобы создать '''SLO''' в '''Мастере настроек''' .
 
==== Пример панели SLO ====
[[Файл:1005.png|граница]]


Дополнительные сведения см. в разделе Доступность хоста .
== Производительность ==


=== Источники данных хоста ===
=== Входящие соединения ===
В разделе Upstream отображается таблица хостов, которые являются восходящими по отношению к выбранному хосту.
В разделе '''Входящие соединения''' отображается таблица хостов, расположенных выше выбранного хоста.


* Выберите любой хост, чтобы перейти на страницу обзора этого хоста.
* Выберите любой хост, чтобы перейти на страницу обзора этого хоста.
* Выберите > Анализ соединений процесса , чтобы отобразить страницу Соединения процесса , на которой можно просмотреть входящие и исходящие соединения.
* Выберите [[Файл:1006.png|граница|37x37пкс]] '''> Анализировать связи процессов''', чтобы отобразить страницу '''Технологические соединения''', на которой можно просмотреть входящие и исходящие соединения.


=== Место назначения данных хоста ===
=== Исходящие соединения ===
В разделе Downstream отображается таблица хостов, которые являются нижестоящими по отношению к выбранному хосту.
В разделе '''Исходящие соединения''' отображается таблица хостов, расположенных ниже выбранного хоста.


* Выберите любой хост, чтобы перейти на страницу обзора этого хоста.
* Выберите любой хост, чтобы перейти на страницу обзора этого хоста.
* Выберите > Анализ соединений процесса , чтобы отобразить страницу Соединения процесса , на которой можно просмотреть входящие и исходящие соединения.
* Выберите [[Файл:1006.png|граница|37x37пкс]] '''> Анализировать связи процессов''', чтобы отобразить страницу '''Технологические соединения''' , на которой можно просмотреть входящие и исходящие соединения.


=== Производительность хоста ===
=== Производительность хоста ===
Перейдите в раздел « Производительность хоста », чтобы быстро получить представление о соответствующих метриках: ЦП, памяти и сети, с различными агрегированными метриками для выбранного периода времени. Просмотр на временной шкале позволяет одновременно выявлять выбранные аномалии во всех диаграммах показателей, что упрощает понимание взаимосвязей между различными компонентами инфраструктуры в определенный момент времени.
Перейдите в раздел '''Производительность хоста''' для быстрого анализа соответствующих метрик: Использование ЦП, памяти и сети с различными агрегациями метрик для выбранного периода времени. Просмотр временной шкалы позволяет вам одновременно выявлять выбранные аномалии во всех диаграммах метрик, что упрощает понимание взаимосвязей между различными компонентами инфраструктуры в определенный момент времени.
 
Легко проверить максимальные или минимальные пики потребления ресурсов, поскольку каждая метрическая диаграмма позволяет выбрать различную агрегацию. Пользовательские метрики также могут отображаться вместо метрик по умолчанию, что позволяет проверять определенные отношения между метриками, которые могут быть критичны для любой конкретной конфигурации хоста.
 
'''''Использование диаграмм'''''
 
Выберите в правом верхнем углу диаграммы [[Файл:1006.png|граница|37x37пкс]], чтобы:
 
* '''Показать в проводнике данных''' — открывает '''Визуализацию Метрик''' для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
* '''Закрепить на дашборде''' — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста.  Подробнее см. в разделе [[Закрепление плиток на панели инструментов|'''<u>''Закрепление плиток на панели инструментов''</u>''']].
 
[[Файл:1007.png|граница]]
 
=== Анализ процессов ===
Чтобы лучше понять поведение процесса, перейдите в раздел '''Анализ процессов''' , который отображает и перечисляет процессы, запущенные на выбранном хосте. Выберите процесс, чтобы получить подробную информацию о нем на хосте.
 
'''''Использование диаграмм'''''
 
Выберите в правом верхнем углу диаграммы [[Файл:1006.png|граница|37x37пкс]], чтобы:
 
* '''Показать в проводнике данных''' — открывает '''Визуализацию Метрик''' для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
* '''Закрепить на дашборде''' — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста.  Подробнее см. в разделе [[Закрепление плиток на панели инструментов|'''<u>''Закрепление плиток на панели инструментов''</u>''']].
 
[[Файл:1008.png|граница]]
 
=== Анализ служб ОС ===
'''''Эта функция доступна только для операционных систем Linux и Windows.'''''
 
В разделе анализа служб ОС перечислены службы операционной системы, отслеживаемые на доступность. Для отслеживания службы вам нужна как минимум одна политика с правилами, соответствующими свойствам службы.
 
Для получения дополнительной информации о создании политик мониторинга для служб ОС см. раздел [[Мониторинг сервисов ОС|'''<u>''Мониторинг сервисов ОС''</u>''']].
 
* Выберите любой хост, чтобы перейти на его страницу обзора, затем перейдите в раздел анализа служб ОС .
* Выберите название службы из списка, чтобы открыть страницу обзора услуг , на которой отображаются свойства выбранной службы и диаграмма доступности служб.


Легко проверить максимальные или минимальные пики потребления ресурсов, поскольку каждая метрическая диаграмма позволяет выбрать другую агрегацию. Пользовательские метрики также могут отображаться вместо метрик по умолчанию, что позволяет проверять определенные взаимосвязи между метриками, которые могут иметь решающее значение для любой конкретной конфигурации хоста.
Чтобы настроить политики для служб ОС для операционных систем Windows и Linux, выберите [[Файл:1006.png|граница|37x37пкс]]'''> Параметры мониторинга служб ОС''' , чтобы отобразить страницу '''Мониторинг служб ОС'''.


Используйте эти диаграммы
=== Снапшоты экземпляра процесса ===
'''''ЕдиныйАгент версии 1.237+'''''


=== Анализ процесса ===
Раздел '''Снапшоты экземпляров процессов''' '''(Process instance snapshots)''' предлагает дополнительную информацию о наиболее ресурсоемких процессах, запущенных на вашем хосте, и процессах, определенных для мониторинга доступности процессов.
Чтобы лучше понять поведение процессов, перейдите в раздел « Анализ процессов », в котором представлены диаграммы и списки процессов, запущенных на выбранном хосте. Выберите процесс для получения подробной информации об этом процессе на хосте.


Используйте эти диаграммы
[[Файл:1009.png|граница]]


=== Моментальные снимки экземпляра процесса ===
'''Снапшоты экземпляров процессов''' '''(Process instance snapshots)''' — это набор данных мониторинга для процессов. Он содержит данные об использовании ЦП процессом (%) , использовании памяти (Б) , входящем сетевом трафике (КБ) и исходящем сетевом трафике (КБ), измеренные с интервалом в одну минуту. Один снапшот содержит 20 минут данных мониторинга: 10 минут до срабатывания и 10 минут после срабатывания. Каждый хост может сообщать только 60 минут этих показателей в день. Процесс рассматривается для снапшота, если его потребление ЦП, памяти или сети составляет более 1%.
ЕдиныйАгент 1.237+


Раздел « Снимки экземпляра процесса » предлагает дополнительную информацию о наиболее ресурсоемких процессах, запущенных на вашем хосте, и процессах, определенных для мониторинга доступности процессов .
'''Снапшоты экземпляров процессов''' '''(Process instance snapshots)''' запускается при высокой загрузке ЦП, памяти или сети на вашем хосте. Вы также можете запросить снапшот процесса вручную.  


Один моментальный снимок экземпляра процесса представляет собой набор данных мониторинга для процессов. Он содержит данные об использовании ЦП процессом (%) , использовании памяти (Б) , входящем сетевом трафике (КБ) и исходящем сетевом трафике (КБ) , измеренные с интервалом в одну минуту. Один снимок содержит данные мониторинга за 20 минут: 10 минут до запуска и 10 минут после запуска. Каждый хост может сообщать только 60 минут этих показателей в день. Процесс рассматривается для моментального снимка, если потребление им ЦП, памяти или сети превышает 1%.
Выберите в правом верхнем углу раздела и выберите [[Файл:1006.png|граница|37x37пкс]]'''> Запросить Снапшот''' '''процесса сейчас'''.  


Моментальный снимок экземпляра процесса инициируется высокой загрузкой ЦП, памяти или сети на вашем хосте. Вы также можете запросить моментальный снимок процесса вручную. Выберите в правом верхнем углу раздела и выберите Запросить моментальный снимок процесса сейчас . Дождитесь сообщения, подтверждающего успешный запуск моментального снимка. Данные моментального снимка процесса должны появиться после перезагрузки страницы в течение 90 секунд.
Дождитесь сообщения, подтверждающего успешный запуск снапшота. Данные снапшота процесса должны появиться после перезагрузки страницы в течение 90 секунд.


Кроме того, для процессов, определенных для мониторинга доступности процессов , моментальный снимок показывает, как вели себя процессы до исчезновения и появлялись ли они снова в течение 10 минут.
Кроме того, для процессов, определенных для мониторинга доступности процессов , снапшот показывает, как вели себя процессы до их исчезновения и появлялись ли они снова в течение 10 минут.


==== Включить моментальные снимки экземпляра процесса ====
==== Включить моментальные снапшоты экземпляра процесса ====
Вы можете включить моментальные снимки экземпляра процесса на уровне хоста или среды.
Вы можете включить моментальные снапшоты экземпляров процесса на уровне хоста или среды.


* Чтобы включить его на уровне среды, в меню Ключ-АСТРОМ перейдите в « Настройки », выберите « Процессы и контейнеры » > «Снимки экземпляра процесса » и включите параметр « Включить снимки экземпляра процесса » .
* Чтобы включить его на уровне среды, перейдите в '''Настройки''' , выберите '''Процессы и контейнеры''' > '''Снапшоты экземпляров процессов'''  и включите параметр '''Включить снапшоты экземпляра процесса'''.
* Чтобы определить правило на уровне хоста, перейдите на страницу обзора хоста, выберите , перейдите в Настройки , выберите Моментальные снимки экземпляра процесса и включите параметр Включить моментальные снимки экземпляра процесса .
* Чтобы определить правило на уровне хоста, перейдите на страницу обзора хоста, выберите [[Файл:1006.png|граница|37x37пкс]], перейдите в раздел '''Настройки''' > '''Снапшоты экземпляров процессов''' и включите '''Включить снапшоты экземпляра процесса'''.
* Чтобы определить правило на уровне группы хостов, перейдите на страницу группы хостов по адресу <code><nowiki>https://your-environment/ui/settings/HOST_GROUP-NAME</nowiki></code>, выберите Моментальные снимки экземпляра процесса и включите параметр Включить моментальные снимки экземпляра процесса .
* Чтобы определить правило уровня группы хостов, перейдите на страницу группы хостов по адресу <code><nowiki>https://your-environment/ui/settings/HOST_GROUP-NAME</nowiki></code>, выберите '''Снапшоты экземпляров процессов''' и включите '''Включить снапшоты экземпляра процесса'''.


На той же странице настроек вы также можете уменьшить лимит процессов, сообщаемых в одном снимке. Максимальная настройка по умолчанию — 100 процессов.
На той же странице настроек вы также можете снизить лимит процессов, сообщаемых в одном снапшоте. Максимальное значение по умолчанию — 100 процессов.


=== Анализ диска ===
=== Анализ диска ===
Для выявления узких мест в производительности диска перейдите в раздел Анализ диска , в котором отображаются все точки монтирования для Linux-систем и все тома для Windows. С первого взгляда вы можете увидеть показатели использования дискового пространства и пропускной способности в дополнение к другим выбранным показателям диска, что позволяет быстро выявить любые проблемы с производительностью диска.
Чтобы определить узкие места производительности диска, перейдите в раздел '''Анализ диска''' , который отображает все точки монтирования для систем Linux и все тома для Windows. На первый взгляд вы можете увидеть метрики использования дискового пространства и пропускной способности, в дополнение к другим выбранным метрикам диска, что позволяет быстро идентифицировать любые проблемы производительности диска.
 
* На странице хоста отфильтруйте диски по имени диска, чтобы сосредоточиться на выбранном диске.
* Разверните запись диска, чтобы увидеть сведения о выбранном диске. Каждый экземпляр диска отображает отдельные подробные метрики производительности, что позволяет легко обнаружить любой дисковый ресурс, который не работает оптимально.
 
Каждая точка монтирования (Linux) или том (Windows) имеет свои собственные метрики производительности в дополнение к объединенным метрикам. Это позволяет намного проще обнаружить медленный или нестабильный диск. Оповещения можно устанавливать как для отдельных дисков, так и для объединенных диаграмм.
 
'''''Использование диаграмм'''''
 
Выберите в правом верхнем углу диаграммы [[Файл:1006.png|граница|37x37пкс]], чтобы:
 
* '''Показать в проводнике данных''' — открывает '''Визуализацию Метрик''' для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
* '''Закрепить на дашборде''' — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста.  Подробнее см. в разделе [[Закрепление плиток на панели инструментов|'''<u>''Закрепление плиток на панели инструментов''</u>''']].
 
[[Файл:1010.png|граница]]
 
=== Мониторинг диска ===
 
==== Ограничения ====
 
* Поддерживаемые метрики диска
 
'''''Поддерживаемые метрики диска'''''
 
* Развертывание на основе установщика ЕдиногоАгента:
** Сетевые диски поддерживаются для хостов Linux, хостов AIX, а с момента выпуска '''''ЕдиногоАгента версии 1.277''''' мониторинг сетевых дисков также включен в Windows.
** '''SMB 1.0''' поддерживается начиная с версии '''''ЕдиногоАгента 1.263'''''.
* Развертывание только приложения '''ЕдиныйАгент''':
** '''ЕдиныеАгенты''', предназначенные только для приложений, предоставляют сокращенный набор метрик дискового ввода-вывода, таких как:
*** <code>Disk read bytes per second</code>
*** <code>Disk write bytes per second</code>
*** <code>Disk read operations per second</code>
*** <code>Write operations per second</code>
** '''Linux''' использует файл <code>/proc/diskstats</code>, который предоставляет информацию об активности дискового ввода-вывода в системе. <code>/proc/diskstats</code> не предоставляет никакой информации о сетевых монтированиях.
** '''Solaris''' не предоставляет никакой информации о дисковом вводе-выводе.
** '''AIX''' сообщает только информацию о дисковом вводе-выводе <code>Disk read bytes per second</code> и <code>Disk write bytes per second</code>.
* '''только для Windows''' На странице диска отображаются только локальные диски с буквой и/или точкой монтирования. Для удаленных дисков система распознает и отображает только общие ресурсы с протоколом CIFS.  Подробности см. на странице [https://learn.microsoft.com/en-us/windows/win32/fileio/microsoft-smb-protocol-and-cifs-protocol-overview '''<u>''Microsoft SMB Protocol and CIFS Protocol Overview''</u>'''].
 
==== Отключить мониторинг определенных дисков ====
Установите фильтр исключений, чтобы избежать проблем со специальными точками монтирования:
 
# Перейдите в '''Настройки > Предпочтения > Настройки дисков'''.
# Выберите '''Добавить элемент''' , чтобы исключить диск из списка мониторинга.
# Укажите вашу ОС, путь к диску и тип файловой системы.
# Выберите '''Сохранить изменения''' .
 
=== Оповещение Дисков ===
'''''ЕдиныйАгент версии 1.293+'''''
 
Используйте '''Правила обнаружения аномалий диска''' для настройки оповещений для автоматического обнаружения аномалий производительности, связанных с дисковой инфраструктурой.
 
'''Правила обнаружения аномалий диска''' обеспечивает автоматическое обнаружение аномалий производительности, связанных с дисковой инфраструктурой. Используйте эти настройки для настройки чувствительности обнаружения в соответствии с именем конкретного диска и/или пользовательскими метаданными. Определение пользовательских свойств может помочь в последующей обработке события.
 
Вы можете определить политики на уровне хоста, группы хостов и среды.
 
# Перейдите в '''Настройки > Обнаружение аномалий > Инфраструктура > Правила обнаружения аномалий диска'''.
# Выберите Добавить элемент.
# Определите элемент.
#* '''Имя элемента''' : название, под которым будет указан ваш элемент.
#* '''Метрика для оповещения''' : Один элемент может иметь до семи оповещений, по одному для каждого типа событий. См. таблицу ниже.
#* '''Ограничение выборки''' : Оповещать только в том случае, если порог был нарушен как минимум в ''n'' из последних ''m'' выборок
#* '''Фильтры имени диска''' : правила можно фильтровать по имени диска.
 
{| class="wikitable"
!Событие
!Значение
!Связанная метрика ЕдиногоАгента
|-
|Доступное дисковое пространство (%) ниже
|Меньшее значение означает более серьезную проблему.
|Поле объекта DiskStats: <code>availPercentage</code>
Метрика Mintv2: <code>ka.host.disk.free</code>
 
Временные ряды: <code>builtin:host.disk.free</code>
|-
|Доступное дисковое пространство (МиБ) ниже
|Меньшее значение означает более серьезную проблему.
|Поле объекта DiskStats: <code>avail</code>
Метрика Mintv2: <code>ka.host.disk.avail</code>
 
Временные ряды: <code>builtin:host.disk.avail</code>
|-
|Доступные иноды (%) ниже
|Меньшее значение означает более серьезную проблему.
|Поле объекта DiskStats: <code>availINodesPercentag</code>
Метрика Mintv2: <code>ka.host.disk.inodes_avail</code>
 
Временные ряды: <code>builtin:host.disk.inodesAvail</code>
|-
|Доступные иноды (число) ниже
|Меньшее значение означает более серьезную проблему.
|Рассчитано с помощью Diskstats: <code>totalINodes</code>* <code>availINodesPercentage</code>
Метрика Mintv2: <code>ka.host.disk.inodes_avail</code>* <code>ka.host.disk.inodes_total</code>


* Фильтровать диски по имени диска, чтобы сосредоточиться на выбранном диске
Временной ряд: <code>builtin:host.disk.inodesTotal</code>*<code>builtin:host.disk.inodesAvail</code>
* Разверните запись диска, чтобы просмотреть сведения о выбранном диске. Для каждого экземпляра диска отображаются отдельные подробные показатели производительности, что позволяет легко определить, какой дисковый ресурс работает неоптимально.
|-
|Файловая система только для чтения
|Н/Д
|Поле объекта диска: <code>readOnly</code>
Mintv2 метрика: N/A


Каждая точка подключения (Linux) или том (Windows) имеет собственные показатели производительности в дополнение к комбинированным показателям. Это позволяет намного легче обнаружить медленный или неустойчивый диск. Оповещения можно настроить как для отдельных дисков, так и для комбинированных графиков.
Timeseries: N/A
|-
|Время чтения (мс) превышает
|Большее значение означает более серьезную проблему.
|Поле объекта диска: <code>reakaime</code>
Метрика Mintv2: <code>ka.host.disk.read_time</code>


Используйте эти диаграммы
Временные ряды: <code>builtin:host.disk.reakaime</code>
|-
|Время записи (мс) превышает
|Большее значение означает более серьезную проблему.
|Поле объекта диска: <code>writeTime</code>
Метрика Mintv2: <code>ka.host.disk.write_time</code>


=== Сетевой анализ ===
Временные ряды: <code>builtin:host.disk.writeTime</code>
Чтобы быстро выявить проблемы, связанные с сетью, перейдите в раздел Анализ сети , в котором перечислены все сетевые интерфейсы и объединенные показатели для всех из них, в дополнение к отдельным показателям для каждого сетевого интерфейса.
|}
 
== Инфраструктура ==
 
=== Анализ сети ===
Чтобы быстро обнаружить проблемы, связанные с сетью, перейдите в раздел '''Анализ сети''', в котором перечислены все сетевые интерфейсы и объединенные метрики для всех них, а также отдельные метрики для каждого сетевого интерфейса.


Используйте этот раздел, чтобы:
Используйте этот раздел, чтобы:


* Выявление потери пакетов, пакетов с ошибками и других сетевых проблем
* Выявление потери пакетов, ошибок пакетов и других сетевых проблем
* Поиск сетевых интерфейсов по сетевому имени
* Поиск сетевых интерфейсов по имени сети
* Выявление узких мест в сети вплоть до конкретного адаптера
* Определите узкие места сети вплоть до конкретного адаптера
 
'''''Использование диаграмм'''''
 
Выберите в правом верхнем углу диаграммы [[Файл:1006.png|ссылка=https://doc.ruscomtech.ru/index.php/%D0%A4%D0%B0%D0%B9%D0%BB:1006.png|граница|37x37пкс]], чтобы:


Используйте эти диаграммы
* '''Показать в проводнике данных''' — открывает '''Визуализацию Метрик''' для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
* '''Закрепить на дашборде''' — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе [[Закрепление плиток на панели инструментов|'''<u>''Закрепление плиток на панели инструментов''</u>''']].
 
[[Файл:1011.png|граница]]


=== Анализ памяти ===
=== Анализ памяти ===
Используйте раздел анализа памяти, чтобы проанализировать:
Используйте раздел '''Анализ памяти''' для анализа:


* Использование памяти — общая память, используемая память и память, которую можно восстановить.
* '''Использование памяти''' — общая память, используемая память и память, которую можно освободить.
* Ошибки страницы — количество ошибок страницы в секунду.
* '''Ошибки страницы''' — количество ошибок страниц в секунду
* Использование свопа — общий объем свопа и использованный своп
* '''Использование свопа''' — общий объем свопа и использованный своп


Используйте эти диаграммы
'''''Использование диаграмм'''''
 
Выберите в правом верхнем углу диаграммы [[Файл:1006.png|ссылка=https://doc.ruscomtech.ru/index.php/%D0%A4%D0%B0%D0%B9%D0%BB:1006.png|граница|37x37пкс]], чтобы:
 
* '''Показать в проводнике данных''' — открывает '''Визуализацию Метрик''' для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
* '''Закрепить на дашборде''' — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе [[Закрепление плиток на панели инструментов|'''<u>''Закрепление плиток на панели инструментов''</u>''']].


=== События ===
=== События ===
В разделе событий отображаются последние события хоста, сгенерированные ИИ, с четкой временной шкалой для быстрого определения критических событий. Представление временной шкалы является интерактивным, фильтруя события вокруг определенного момента, что упрощает выделение конкретного события. Кроме того, различные типы событий имеют цветовую маркировку для более простой и быстрой идентификации и просмотра.
Раздел событий отображает недавние события хоста, которые сгенерировал Davis AI, с четким представлением временной шкалы для быстрого определения критических событий. Представление временной шкалы является интерактивным, фильтруя события вокруг определенного момента, что упрощает выделение определенного события. Кроме того, различные типы событий имеют цветовую кодировку для более легкой и быстрой идентификации и просмотра.


* Показать одну карточку — открывает карточку событий для выбранного хоста.
* Показать одну карточку — открывает карточку событий для выбранного хоста.


=== Журналы ===
=== Журналы ===
Временная шкала средства просмотра журнала является интерактивной и позволяет выбирать глобальную временную шкалу. Используйте его, чтобы выявить проблемы, связанные с конкретным событием журнала, и посмотреть, как оно связано с производительностью или процессами хостинга.
Временная шкала просмотра журнала интерактивна, что позволяет выбирать глобальную временную шкалу. Используйте ее для выявления проблем вокруг определенного события журнала и просмотра того, как оно связано с производительностью хостинга или процессами.
 
* Выбор времени всей главной страницы будет соответствовать тому, что выбрано в средстве просмотра журнала. Таким образом, журнал ошибок можно легко сравнить с показателями производительности хоста или показателями процесса во время возникновения ошибки журнала. Тот же выбор временной шкалы появится на карточке события.
* Вы можете фильтровать журналы по группе процессов, статусу, уровню журнала и другим параметрам, позволяя искать, например, только журналы ошибок или журналы об определенном процессе.


Используйте эту информацию
* Весь выбор времени страницы хоста будет соответствовать тому, что выбрано в средстве просмотра журнала. Таким образом, журнал ошибок можно легко сравнить с показателями производительности хоста или показателями процесса в то время, когда произошла ошибка журнала. Тот же выбор временной шкалы появится на карточке события.
* Вы можете фильтровать журналы по группе процессов, статусу, уровню журнала и другим параметрам, что позволяет искать, например, только журналы ошибок или журналы определенного процесса.


Выберите в правом верхнем углу раздела Журналы , чтобы:
Выберите в правом верхнем углу раздела «Журналы» , чтобы:


* Перейти к просмотрщику журналов — открывает страницу просмотра журналов , отфильтрованную по выбранному хосту.
* Перейти к средству просмотра журналов — открывает страницу средства просмотра журналов , отфильтрованную по выбранному хосту.
* Создать метрику — открывает страницу метрик журнала со значением запроса , установленным для выбранного хоста.
* Создать метрику — открывает страницу метрик журнала со значением запроса , установленным для выбранного хоста.

Версия 16:15, 19 января 2025

Применение Ключ-АСТРОМ / Хосты / Мониторинг / Мониторинг хоста с помощью Ключ-АСТРОМ

Как только данные о хостах собраны, ИИ мгновенно начинает базовую оценку данных. Каждая метрика, отображаемая на странице обзора хоста, является частью исходных данных ИИ, используемых для автоматического выявления потенциальных проблем производительности на уровне инфраструктуры или полного стека.

Как добраться:

  1. Перейдите в раздел Хосты (последняя версия Ключ-АСТРОМ), чтобы получить список всех хостов (физических или виртуальных) в вашей среде, на которых установлен ЕдиныйАгент.
  2. Выберите имя хоста в списке, чтобы перейти на страницу обзора этого хоста.

Все соответствующие показатели хоста отображаются на одной странице, которая разделена на несколько логических разделов.

Панель уведомлений

Панель уведомлений хоста дает вам быстрый обзор состояния хоста. Выберите элемент уведомления, чтобы отобразить больше информации.

Свойства и теги

Выберите Свойства и теги на панели уведомлений, чтобы отобразить панель Свойства и теги, на которой отображаются метаданные о выбранном хосте:

  • Теги перечисляют теги, которые в настоящее время применяются к хосту. Выберите Добавить тег , чтобы добавить тег к метаданным хоста.
  • В разделе Свойства перечислены различные свойства хоста, такие как версия ЕдиныйАгент, версия ОС, режим мониторинга, IP-адреса и зоны управления.

Проблемы

  • На панели уведомлений в разделе Проблемы отображаются активные и закрытые проблемы, связанные с выбранным хостом.
  • Выберите Проблемы на панели уведомлений, чтобы отобразить панель Проблемы, на которой перечислены проблемы.
    • Выберите проблему для отображения подробностей.
    • Выберите Перейти в проблемы , чтобы перейти на страницу проблем , отсортированную по выбранному хосту.

Уязвимости

  • На панели уведомлений в разделе Уязвимости отображаются наиболее часто обнаруженные уязвимости, влияющие на выбранный хост.
  • Выберите Уязвимости на панели уведомлений, чтобы отобразить панель Уязвимости , на которой перечислены наиболее серьезные сторонние уязвимости и уязвимости на уровне кода, связанные с этим хостом.
    • Выберите уязвимость в списке, чтобы просмотреть подробную информацию и понять серьезность и влияние уязвимости в вашей среде.
    • Для получения полного списка обнаруженных уязвимостей, влияющих на этот хост, выберите Вид all third-party уязвимости / Вид other code-level уязвимости снизу вкладок Сторонние уязвимости / Уязвимости в коде. Примеры уязвимостей: 1001.png 1002.png Если у вас отсутствуют разрешения безопасности для выбранной зоны управления, на вкладке Уязвимости на панели уведомлений отобразится Not analyzed.

Доступность

  • На панели уведомлений Доступность показывает процент времени, в течение которого хост был в сети и отвечал на запросы. Ключ-АСТРОМ обнаруживает и показывает выключения операционной системы (включая перезагрузки) и периоды, когда хост находится в автономном режиме (например, если хост неожиданно отключается).

Выберите Доступность на панели уведомлений, чтобы отобразить панель Доступность хоста, на которой отображается доступность хоста с течением времени.

1003.png

SLO

  • На панели уведомлений SLO отображает текущее количество SLO, относящихся к выбранному хосту.
  • Выберите SLO на панели уведомлений, чтобы отобразить панель целей уровня обслуживания , в которой перечислены SLO, напрямую или косвенно подключенные к хосту.

SLO подключенные напрямую

  • SLO напрямую подключается к хосту, когда селектор сущностей SLO соответствует следующим критериям:
    • Тип сущности установлен на "HOST".
    • Идентификатор сущности устанавливается равным идентификатору хоста.
  • Чтобы увидеть только SLO, напрямую подключенные к хосту, убедитесь, что включен параметр Показывать только напрямую связанные SLO .

Косвенно подключенные SLO

  • SLO не подключается напрямую к хосту, если в селекторе сущностей SLO не указан идентификатор сущности. Пример: Если указаны общие значения, такие как type("HOST"),tag("slo"), запрос возвращает все SLO для всех хостов, включая текущий хост.
  • Чтобы увидеть SLO, которые не подключены напрямую к хосту, отключите параметр Показывать только напрямую связанные SLO.

Параметры

  • Выберите Детали , чтобы просмотреть диаграмму соответствующих показателей SLO.
  • В разделе Действия выберите
    • Чтобы увидеть показатели SLO в Визуализации Метрик, откройте его .
    • Закрепить на дашборде , чтобы закрепить SLO на дашборде . Подробности см. в разделе Закрепление плиток на панели инструментов.
    • SLO определения для редактирования SLO в определениях целей уровня обслуживания .
    • Клонировать для клонирования SLO .
    • Создать оповещение , чтобы создать оповещение для SLO .

Нет SLO

Если SLO не найдены, вы можете

  • Выберите другой таймфрейм в правом верхнем углу. 1004.png
  • Выберите Добавить SLO , чтобы создать SLO в Мастере настроек .

Пример панели SLO

1005.png

Производительность

Входящие соединения

В разделе Входящие соединения отображается таблица хостов, расположенных выше выбранного хоста.

  • Выберите любой хост, чтобы перейти на страницу обзора этого хоста.
  • Выберите 1006.png > Анализировать связи процессов, чтобы отобразить страницу Технологические соединения, на которой можно просмотреть входящие и исходящие соединения.

Исходящие соединения

В разделе Исходящие соединения отображается таблица хостов, расположенных ниже выбранного хоста.

  • Выберите любой хост, чтобы перейти на страницу обзора этого хоста.
  • Выберите 1006.png > Анализировать связи процессов, чтобы отобразить страницу Технологические соединения , на которой можно просмотреть входящие и исходящие соединения.

Производительность хоста

Перейдите в раздел Производительность хоста для быстрого анализа соответствующих метрик: Использование ЦП, памяти и сети с различными агрегациями метрик для выбранного периода времени. Просмотр временной шкалы позволяет вам одновременно выявлять выбранные аномалии во всех диаграммах метрик, что упрощает понимание взаимосвязей между различными компонентами инфраструктуры в определенный момент времени.

Легко проверить максимальные или минимальные пики потребления ресурсов, поскольку каждая метрическая диаграмма позволяет выбрать различную агрегацию. Пользовательские метрики также могут отображаться вместо метрик по умолчанию, что позволяет проверять определенные отношения между метриками, которые могут быть критичны для любой конкретной конфигурации хоста.

Использование диаграмм

Выберите в правом верхнем углу диаграммы 1006.png, чтобы:

  • Показать в проводнике данных — открывает Визуализацию Метрик для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
  • Закрепить на дашборде — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе Закрепление плиток на панели инструментов.

1007.png

Анализ процессов

Чтобы лучше понять поведение процесса, перейдите в раздел Анализ процессов , который отображает и перечисляет процессы, запущенные на выбранном хосте. Выберите процесс, чтобы получить подробную информацию о нем на хосте.

Использование диаграмм

Выберите в правом верхнем углу диаграммы 1006.png, чтобы:

  • Показать в проводнике данных — открывает Визуализацию Метрик для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
  • Закрепить на дашборде — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе Закрепление плиток на панели инструментов.

1008.png

Анализ служб ОС

Эта функция доступна только для операционных систем Linux и Windows.

В разделе анализа служб ОС перечислены службы операционной системы, отслеживаемые на доступность. Для отслеживания службы вам нужна как минимум одна политика с правилами, соответствующими свойствам службы.

Для получения дополнительной информации о создании политик мониторинга для служб ОС см. раздел Мониторинг сервисов ОС.

  • Выберите любой хост, чтобы перейти на его страницу обзора, затем перейдите в раздел анализа служб ОС .
  • Выберите название службы из списка, чтобы открыть страницу обзора услуг , на которой отображаются свойства выбранной службы и диаграмма доступности служб.

Чтобы настроить политики для служб ОС для операционных систем Windows и Linux, выберите 1006.png> Параметры мониторинга служб ОС , чтобы отобразить страницу Мониторинг служб ОС.

Снапшоты экземпляра процесса

ЕдиныйАгент версии 1.237+

Раздел Снапшоты экземпляров процессов (Process instance snapshots) предлагает дополнительную информацию о наиболее ресурсоемких процессах, запущенных на вашем хосте, и процессах, определенных для мониторинга доступности процессов.

1009.png

Снапшоты экземпляров процессов (Process instance snapshots) — это набор данных мониторинга для процессов. Он содержит данные об использовании ЦП процессом (%) , использовании памяти (Б) , входящем сетевом трафике (КБ) и исходящем сетевом трафике (КБ), измеренные с интервалом в одну минуту. Один снапшот содержит 20 минут данных мониторинга: 10 минут до срабатывания и 10 минут после срабатывания. Каждый хост может сообщать только 60 минут этих показателей в день. Процесс рассматривается для снапшота, если его потребление ЦП, памяти или сети составляет более 1%.

Снапшоты экземпляров процессов (Process instance snapshots) запускается при высокой загрузке ЦП, памяти или сети на вашем хосте. Вы также можете запросить снапшот процесса вручную.

Выберите в правом верхнем углу раздела и выберите 1006.png> Запросить Снапшот процесса сейчас.

Дождитесь сообщения, подтверждающего успешный запуск снапшота. Данные снапшота процесса должны появиться после перезагрузки страницы в течение 90 секунд.

Кроме того, для процессов, определенных для мониторинга доступности процессов , снапшот показывает, как вели себя процессы до их исчезновения и появлялись ли они снова в течение 10 минут.

Включить моментальные снапшоты экземпляра процесса

Вы можете включить моментальные снапшоты экземпляров процесса на уровне хоста или среды.

  • Чтобы включить его на уровне среды, перейдите в Настройки , выберите Процессы и контейнеры > Снапшоты экземпляров процессов и включите параметр Включить снапшоты экземпляра процесса.
  • Чтобы определить правило на уровне хоста, перейдите на страницу обзора хоста, выберите 1006.png, перейдите в раздел Настройки > Снапшоты экземпляров процессов и включите Включить снапшоты экземпляра процесса.
  • Чтобы определить правило уровня группы хостов, перейдите на страницу группы хостов по адресу https://your-environment/ui/settings/HOST_GROUP-NAME, выберите Снапшоты экземпляров процессов и включите Включить снапшоты экземпляра процесса.

На той же странице настроек вы также можете снизить лимит процессов, сообщаемых в одном снапшоте. Максимальное значение по умолчанию — 100 процессов.

Анализ диска

Чтобы определить узкие места производительности диска, перейдите в раздел Анализ диска , который отображает все точки монтирования для систем Linux и все тома для Windows. На первый взгляд вы можете увидеть метрики использования дискового пространства и пропускной способности, в дополнение к другим выбранным метрикам диска, что позволяет быстро идентифицировать любые проблемы производительности диска.

  • На странице хоста отфильтруйте диски по имени диска, чтобы сосредоточиться на выбранном диске.
  • Разверните запись диска, чтобы увидеть сведения о выбранном диске. Каждый экземпляр диска отображает отдельные подробные метрики производительности, что позволяет легко обнаружить любой дисковый ресурс, который не работает оптимально.

Каждая точка монтирования (Linux) или том (Windows) имеет свои собственные метрики производительности в дополнение к объединенным метрикам. Это позволяет намного проще обнаружить медленный или нестабильный диск. Оповещения можно устанавливать как для отдельных дисков, так и для объединенных диаграмм.

Использование диаграмм

Выберите в правом верхнем углу диаграммы 1006.png, чтобы:

  • Показать в проводнике данных — открывает Визуализацию Метрик для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
  • Закрепить на дашборде — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе Закрепление плиток на панели инструментов.

1010.png

Мониторинг диска

Ограничения

  • Поддерживаемые метрики диска

Поддерживаемые метрики диска

  • Развертывание на основе установщика ЕдиногоАгента:
    • Сетевые диски поддерживаются для хостов Linux, хостов AIX, а с момента выпуска ЕдиногоАгента версии 1.277 мониторинг сетевых дисков также включен в Windows.
    • SMB 1.0 поддерживается начиная с версии ЕдиногоАгента 1.263.
  • Развертывание только приложения ЕдиныйАгент:
    • ЕдиныеАгенты, предназначенные только для приложений, предоставляют сокращенный набор метрик дискового ввода-вывода, таких как:
      • Disk read bytes per second
      • Disk write bytes per second
      • Disk read operations per second
      • Write operations per second
    • Linux использует файл /proc/diskstats, который предоставляет информацию об активности дискового ввода-вывода в системе. /proc/diskstats не предоставляет никакой информации о сетевых монтированиях.
    • Solaris не предоставляет никакой информации о дисковом вводе-выводе.
    • AIX сообщает только информацию о дисковом вводе-выводе Disk read bytes per second и Disk write bytes per second.
  • только для Windows На странице диска отображаются только локальные диски с буквой и/или точкой монтирования. Для удаленных дисков система распознает и отображает только общие ресурсы с протоколом CIFS. Подробности см. на странице Microsoft SMB Protocol and CIFS Protocol Overview.

Отключить мониторинг определенных дисков

Установите фильтр исключений, чтобы избежать проблем со специальными точками монтирования:

  1. Перейдите в Настройки > Предпочтения > Настройки дисков.
  2. Выберите Добавить элемент , чтобы исключить диск из списка мониторинга.
  3. Укажите вашу ОС, путь к диску и тип файловой системы.
  4. Выберите Сохранить изменения .

Оповещение Дисков

ЕдиныйАгент версии 1.293+

Используйте Правила обнаружения аномалий диска для настройки оповещений для автоматического обнаружения аномалий производительности, связанных с дисковой инфраструктурой.

Правила обнаружения аномалий диска обеспечивает автоматическое обнаружение аномалий производительности, связанных с дисковой инфраструктурой. Используйте эти настройки для настройки чувствительности обнаружения в соответствии с именем конкретного диска и/или пользовательскими метаданными. Определение пользовательских свойств может помочь в последующей обработке события.

Вы можете определить политики на уровне хоста, группы хостов и среды.

  1. Перейдите в Настройки > Обнаружение аномалий > Инфраструктура > Правила обнаружения аномалий диска.
  2. Выберите Добавить элемент.
  3. Определите элемент.
    • Имя элемента : название, под которым будет указан ваш элемент.
    • Метрика для оповещения : Один элемент может иметь до семи оповещений, по одному для каждого типа событий. См. таблицу ниже.
    • Ограничение выборки : Оповещать только в том случае, если порог был нарушен как минимум в n из последних m выборок
    • Фильтры имени диска : правила можно фильтровать по имени диска.
Событие Значение Связанная метрика ЕдиногоАгента
Доступное дисковое пространство (%) ниже Меньшее значение означает более серьезную проблему. Поле объекта DiskStats: availPercentage

Метрика Mintv2: ka.host.disk.free

Временные ряды: builtin:host.disk.free

Доступное дисковое пространство (МиБ) ниже Меньшее значение означает более серьезную проблему. Поле объекта DiskStats: avail

Метрика Mintv2: ka.host.disk.avail

Временные ряды: builtin:host.disk.avail

Доступные иноды (%) ниже Меньшее значение означает более серьезную проблему. Поле объекта DiskStats: availINodesPercentag

Метрика Mintv2: ka.host.disk.inodes_avail

Временные ряды: builtin:host.disk.inodesAvail

Доступные иноды (число) ниже Меньшее значение означает более серьезную проблему. Рассчитано с помощью Diskstats: totalINodes* availINodesPercentage

Метрика Mintv2: ka.host.disk.inodes_avail* ka.host.disk.inodes_total

Временной ряд: builtin:host.disk.inodesTotal*builtin:host.disk.inodesAvail

Файловая система только для чтения Н/Д Поле объекта диска: readOnly

Mintv2 метрика: N/A

Timeseries: N/A

Время чтения (мс) превышает Большее значение означает более серьезную проблему. Поле объекта диска: reakaime

Метрика Mintv2: ka.host.disk.read_time

Временные ряды: builtin:host.disk.reakaime

Время записи (мс) превышает Большее значение означает более серьезную проблему. Поле объекта диска: writeTime

Метрика Mintv2: ka.host.disk.write_time

Временные ряды: builtin:host.disk.writeTime

Инфраструктура

Анализ сети

Чтобы быстро обнаружить проблемы, связанные с сетью, перейдите в раздел Анализ сети, в котором перечислены все сетевые интерфейсы и объединенные метрики для всех них, а также отдельные метрики для каждого сетевого интерфейса.

Используйте этот раздел, чтобы:

  • Выявление потери пакетов, ошибок пакетов и других сетевых проблем
  • Поиск сетевых интерфейсов по имени сети
  • Определите узкие места сети вплоть до конкретного адаптера

Использование диаграмм

Выберите в правом верхнем углу диаграммы 1006.png, чтобы:

  • Показать в проводнике данных — открывает Визуализацию Метрик для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
  • Закрепить на дашборде — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе Закрепление плиток на панели инструментов.

1011.png

Анализ памяти

Используйте раздел Анализ памяти для анализа:

  • Использование памяти — общая память, используемая память и память, которую можно освободить.
  • Ошибки страницы — количество ошибок страниц в секунду
  • Использование свопа — общий объем свопа и использованный своп

Использование диаграмм

Выберите в правом верхнем углу диаграммы 1006.png, чтобы:

  • Показать в проводнике данных — открывает Визуализацию Метрик для связанного запроса, чтобы вы могли просмотреть связанный запрос, более подробно изучить данные, настроить параметры диаграммы и закрепить диаграмму на своем дашборде.
  • Закрепить на дашборде — закрепляет копию выбранной диаграммы на любом классическом дашборде, который вы можете редактировать. Например, если определенные хосты особенно важны для вашего бизнеса, создайте дашборд, предназначенный для мониторинга только этих хостов, а затем закрепите диаграммы со страниц обзора их хостов на этом дашборде, и все это практически без ввода текста. Подробнее см. в разделе Закрепление плиток на панели инструментов.

События

Раздел событий отображает недавние события хоста, которые сгенерировал Davis AI, с четким представлением временной шкалы для быстрого определения критических событий. Представление временной шкалы является интерактивным, фильтруя события вокруг определенного момента, что упрощает выделение определенного события. Кроме того, различные типы событий имеют цветовую кодировку для более легкой и быстрой идентификации и просмотра.

  • Показать одну карточку — открывает карточку событий для выбранного хоста.

Журналы

Временная шкала просмотра журнала интерактивна, что позволяет выбирать глобальную временную шкалу. Используйте ее для выявления проблем вокруг определенного события журнала и просмотра того, как оно связано с производительностью хостинга или процессами.

  • Весь выбор времени страницы хоста будет соответствовать тому, что выбрано в средстве просмотра журнала. Таким образом, журнал ошибок можно легко сравнить с показателями производительности хоста или показателями процесса в то время, когда произошла ошибка журнала. Тот же выбор временной шкалы появится на карточке события.
  • Вы можете фильтровать журналы по группе процессов, статусу, уровню журнала и другим параметрам, что позволяет искать, например, только журналы ошибок или журналы определенного процесса.

Выберите в правом верхнем углу раздела «Журналы» , чтобы:

  • Перейти к средству просмотра журналов — открывает страницу средства просмотра журналов , отфильтрованную по выбранному хосту.
  • Создать метрику — открывает страницу метрик журнала со значением запроса , установленным для выбранного хоста.