Мониторинг Cassandra

Материал из Документация Ключ-АСТРОМ

Мониторинг сервера Apache Cassandra в Ключ-АСТРОМ предоставляет информацию об исключениях базы данных, неудачных запросах, производительности и многом другом. Если Cassandra работает неэффективно или возникает проблема, Ключ-АСТРОМ немедленно сообщит вам об этом и покажет, какие узлы затронуты.

Начальные условия

  • Cassandra 2.xx
  • Linux или Windows

Включение глобального мониторинга Cassandra

Благодаря глобальному мониторингу Cassandra Ключ-АСТРОМ автоматически собирает метрики Cassandra всякий раз, когда в вашей среде обнаруживается новый хост, на котором запущена Cassandra.

  1. В меню Ключ-АСТРОМ перейдите в « Настройки » .
  2. Выберите Мониторинг > Отслеживаемые технологии .
  3. В списке Поддерживаемые технологии найдите строку Cassandra JMX.
  4. Включите переключатель Cassandra JMX .

Мониторинг Cassandra в Ключ-АСТРОМ

  1. В меню Ключ-АСТРОМ выберите « Технологии » .
  2. Выберите плитку Apache Cassandra .
  3. Чтобы просмотреть метрики кластера Cassandra, выберите кластер в таблице группы процессов под плитками. На диаграмме отображается метрика выбранной группы процессов (кластера) с течением времени. Вы можете выбрать другую метрику из списка.
  4. В развернутой строке выберите Сведения о группе процессов, чтобы просмотреть сведения о выбранном кластере Cassandra.
  5. На странице сведений о группе процессов выберите вкладку Метрики, характерные для технологии, чтобы выявить проблемные узлы.
  6. Чтобы отобразить метрики, относящиеся к узлу, выберите узел в списке Процесс под диаграммой.
  7. Выберите вкладку Метрики Cassandra , чтобы увидеть ценные метрики Cassandra для конкретного узла.
    • Диаграммы исключений и неудачных запросов показывают, есть ли проблема с узлом. Обратите особое внимание на счетчики « Недоступно-чтение », « Недоступно-запись » и «Недоступно-RangeSlice» в списке « Неудачные запросы » .
    • Диаграммы количества операций и задержки 95-го процентиля могут помочь вам контролировать производительность. Увеличение задержки при неизменном количестве операций обычно указывает на проблемы с производительностью.
  8. Выберите вкладку Дополнительные сведения , чтобы просмотреть диаграммы по различным дополнительным показателям Cassandra.

Метрики кластера Cassandra

Выберите вкладку Метрики для конкретных технологий на странице сведений о группе процессов , чтобы отобразить сводные метрики кластера Cassandra. Используйте список Показать диаграмму для , чтобы изменить отображаемую диаграмму. Все метрики отображаются в зависимости от количества экземпляров группы процессов. Наведите указатель мыши на диаграмму, чтобы увидеть количество экземпляров, а также минимальное, максимальное и среднее значение для выбранной метрики на данный момент.

  • Приостановка
  • Потоки JVM
  • Фиксация пула памяти Java
  • Используемый пул памяти Java
  • Время GC (время сборки мусора)
  • Количество исключений
  • Открытые файлы
  • Задержка RangeSlice
  • RangeSlices
  • Задержка чтения
  • Чтение
  • Загрузка хранилища
  • Задержка записи
  • Запись

Метрики узла Cassandra

Вкладка показателей Cassandra

На вкладке метрик Cassandra показаны ключевые метрики для Cassandra на уровне узла.

Диаграмма Метрика Описание
Исключения Exception count Количество обнаруженных внутренних исключений Cassandra. В нормальных условиях этот показатель должен быть равен нулю.
Неудачные запросы Unavailable – Read Количество Unavailable – Readобнаруженных исключений.
Unavailable – Write Количество Unavailable – Writeобнаруженных исключений.
Unavailable – RangeSlice Количество Unavailable – RangeSliceобнаруженных исключений.
Timeout – Read Количество Timeout – Readобнаруженных исключений.
Timeout – Write Количество Timeout – Writeобнаруженных исключений.
Timeout – RangeSlice Количество Timeout – RangeSliceобнаруженных исключений.
Failure – Read Количество Failure – Readобнаруженных исключений.
Failure – Write Количество Failure – Writeобнаруженных исключений.
Failure – RangeSlice Количество Failure – RangeSliceобнаруженных исключений.
Количество операций Read Среднее количество чтений в секунду.
Write Среднее количество операций записи в секунду.
RangeSlice Среднее количество RangeSlices в секунду.
Задержка 95-й процентиль Read Средняя 95-я процентиль задержки чтения транзакции.
Write Средняя 95-я процентиль задержки записи транзакции.
RangeSlice Средняя 95-я процентиль задержки транзакции RangeSlice.

Вкладка «Дополнительная информация»

На вкладке Дополнительные сведения показаны дополнительные метрики для Cassandra на уровне узла: Кэш , Использование диска , Подсказки , Управляемая память Java , Загрузка и Ожидающие задачи .

Диаграмма Метрика Описание
Кэш: Частота попаданий Row cache hit rate Частота попаданий в кэш 2 млн строк.
Key cache hit rate Частота попаданий в строку кэша ключей 2 млн.
Использование диска: нагрузка на хранилище Load Размер в байтах данных на диске, которыми управляет узел.
Использование диска: байты сжаты Bytes compacted Общее количество байтов, сжатых с момента запуска сервера.
Использование диска: ожидаются задачи сжатия Pending tasks Предполагаемое количество уплотнений, которые осталось выполнить.
Использование диска: задачи сжатия выполнены Completed tasks Количество завершенных уплотнений с момента запуска сервера.
Использование диска: количество SSTable SSTable count Количество SSTables на диске для этой таблицы.
Подсказки Hints Количество сообщений-подсказок, записанных на этот узел с момента запуска. Включает в себя одну запись для каждого хоста, на который должна быть сделана подсказка.
Управляемая память Java: имя пула Used memory Java использовала память.
Committed memory Выделенная память Java.
Maximum memory Максимальная память Java.
Garbage collection count Счетчик сборки мусора Java.
Garbage collection time Время сборки мусора Java.
Нагрузка: задержка чтения Average Средняя 95-я процентиль задержки чтения транзакции.
Maximum Максимальный 95-й процентиль задержки чтения транзакции.
Нагрузка: Задержка записи Average Средняя 95-я процентиль задержки записи транзакции.
Maximum Максимальный 95-й процентиль задержки записи транзакции.
Нагрузка: задержка RangeSlice Average Средняя 95-я процентиль задержки транзакции RangeSlice.
Maximum Максимальный 95-й процентиль задержки транзакции RangeSlice.
Нагрузка: скорость чтения Average Среднее количество чтений в секунду.
Maximum Максимальное количество чтений в секунду.
Нагрузка: пропускная способность записи Average Среднее количество операций записи в секунду.
Maximum Максимальное количество записей в секунду.
Нагрузка: пропускная способность RangeSlice Average Среднее количество RangeSlices в секунду.
Maximum Максимальное количество RangeSlices в секунду.
Незавершенные задачи: чтение незавершенных задач Read pending tasks Количество задач мутации чтения.
Отложенные задачи: отложенные задачи ReadRepair ReadRepair pending tasks Количество задач изменения ReadRepair.
Незавершенные задачи: Незавершенные задачи мутации Mutation pending tasks Количество задач мутации в очереди.
Отложенные задачи: сжатие отложенных задач Compaction tasks pending Предполагаемое количество уплотнений, которые осталось выполнить.