Мониторинг Cassandra
Мониторинг сервера Apache Cassandra в Ключ-АСТРОМ предоставляет информацию об исключениях базы данных, неудачных запросах, производительности и многом другом. Если Cassandra работает неэффективно или возникает проблема, Ключ-АСТРОМ немедленно сообщит вам об этом и покажет, какие узлы затронуты.
Начальные условия
- Cassandra 2.xx
- Linux или Windows
Включение глобального мониторинга Cassandra
Благодаря глобальному мониторингу Cassandra Ключ-АСТРОМ автоматически собирает метрики Cassandra всякий раз, когда в вашей среде обнаруживается новый хост, на котором запущена Cassandra.
- В меню Ключ-АСТРОМ перейдите в « Настройки » .
- Выберите Мониторинг > Отслеживаемые технологии .
- В списке Поддерживаемые технологии найдите строку Cassandra JMX.
- Включите переключатель Cassandra JMX .
Мониторинг Cassandra в Ключ-АСТРОМ
- В меню Ключ-АСТРОМ выберите « Технологии » .
- Выберите плитку Apache Cassandra .
- Чтобы просмотреть метрики кластера Cassandra, выберите кластер в таблице группы процессов под плитками. На диаграмме отображается метрика выбранной группы процессов (кластера) с течением времени. Вы можете выбрать другую метрику из списка.
- В развернутой строке выберите Сведения о группе процессов, чтобы просмотреть сведения о выбранном кластере Cassandra.
- На странице сведений о группе процессов выберите вкладку Метрики, характерные для технологии, чтобы выявить проблемные узлы.
- Чтобы отобразить метрики, относящиеся к узлу, выберите узел в списке Процесс под диаграммой.
- Выберите вкладку Метрики Cassandra , чтобы увидеть ценные метрики Cassandra для конкретного узла.
- Диаграммы исключений и неудачных запросов показывают, есть ли проблема с узлом. Обратите особое внимание на счетчики « Недоступно-чтение », « Недоступно-запись » и «Недоступно-RangeSlice» в списке « Неудачные запросы » .
- Диаграммы количества операций и задержки 95-го процентиля могут помочь вам контролировать производительность. Увеличение задержки при неизменном количестве операций обычно указывает на проблемы с производительностью.
- Выберите вкладку Дополнительные сведения , чтобы просмотреть диаграммы по различным дополнительным показателям Cassandra.
Метрики кластера Cassandra
Выберите вкладку Метрики для конкретных технологий на странице сведений о группе процессов , чтобы отобразить сводные метрики кластера Cassandra. Используйте список Показать диаграмму для , чтобы изменить отображаемую диаграмму. Все метрики отображаются в зависимости от количества экземпляров группы процессов. Наведите указатель мыши на диаграмму, чтобы увидеть количество экземпляров, а также минимальное, максимальное и среднее значение для выбранной метрики на данный момент.
- Приостановка
- Потоки JVM
- Фиксация пула памяти Java
- Используемый пул памяти Java
- Время GC (время сборки мусора)
- Количество исключений
- Открытые файлы
- Задержка RangeSlice
- RangeSlices
- Задержка чтения
- Чтение
- Загрузка хранилища
- Задержка записи
- Запись
Метрики узла Cassandra
Вкладка показателей Cassandra
На вкладке метрик Cassandra показаны ключевые метрики для Cassandra на уровне узла.
Диаграмма | Метрика | Описание |
Исключения | Exception count | Количество обнаруженных внутренних исключений Cassandra. В нормальных условиях этот показатель должен быть равен нулю. |
Неудачные запросы | Unavailable – Read | Количество Unavailable – Read обнаруженных исключений.
|
Unavailable – Write | Количество Unavailable – Write обнаруженных исключений.
| |
Unavailable – RangeSlice | Количество Unavailable – RangeSlice обнаруженных исключений.
| |
Timeout – Read | Количество Timeout – Read обнаруженных исключений.
| |
Timeout – Write | Количество Timeout – Write обнаруженных исключений.
| |
Timeout – RangeSlice | Количество Timeout – RangeSlice обнаруженных исключений.
| |
Failure – Read | Количество Failure – Read обнаруженных исключений.
| |
Failure – Write | Количество Failure – Write обнаруженных исключений.
| |
Failure – RangeSlice | Количество Failure – RangeSlice обнаруженных исключений.
| |
Количество операций | Read | Среднее количество чтений в секунду. |
Write | Среднее количество операций записи в секунду. | |
RangeSlice | Среднее количество RangeSlices в секунду. | |
Задержка 95-й процентиль | Read | Средняя 95-я процентиль задержки чтения транзакции. |
Write | Средняя 95-я процентиль задержки записи транзакции. | |
RangeSlice | Средняя 95-я процентиль задержки транзакции RangeSlice. |
Вкладка «Дополнительная информация»
На вкладке Дополнительные сведения показаны дополнительные метрики для Cassandra на уровне узла: Кэш , Использование диска , Подсказки , Управляемая память Java , Загрузка и Ожидающие задачи .
Диаграмма | Метрика | Описание |
Кэш: Частота попаданий | Row cache hit rate | Частота попаданий в кэш 2 млн строк. |
Key cache hit rate | Частота попаданий в строку кэша ключей 2 млн. | |
Использование диска: нагрузка на хранилище | Load | Размер в байтах данных на диске, которыми управляет узел. |
Использование диска: байты сжаты | Bytes compacted | Общее количество байтов, сжатых с момента запуска сервера. |
Использование диска: ожидаются задачи сжатия | Pending tasks | Предполагаемое количество уплотнений, которые осталось выполнить. |
Использование диска: задачи сжатия выполнены | Completed tasks | Количество завершенных уплотнений с момента запуска сервера. |
Использование диска: количество SSTable | SSTable count | Количество SSTables на диске для этой таблицы. |
Подсказки | Hints | Количество сообщений-подсказок, записанных на этот узел с момента запуска. Включает в себя одну запись для каждого хоста, на который должна быть сделана подсказка. |
Управляемая память Java: имя пула | Used memory | Java использовала память. |
Committed memory | Выделенная память Java. | |
Maximum memory | Максимальная память Java. | |
Garbage collection count | Счетчик сборки мусора Java. | |
Garbage collection time | Время сборки мусора Java. | |
Нагрузка: задержка чтения | Average | Средняя 95-я процентиль задержки чтения транзакции. |
Maximum | Максимальный 95-й процентиль задержки чтения транзакции. | |
Нагрузка: Задержка записи | Average | Средняя 95-я процентиль задержки записи транзакции. |
Maximum | Максимальный 95-й процентиль задержки записи транзакции. | |
Нагрузка: задержка RangeSlice | Average | Средняя 95-я процентиль задержки транзакции RangeSlice. |
Maximum | Максимальный 95-й процентиль задержки транзакции RangeSlice. | |
Нагрузка: скорость чтения | Average | Среднее количество чтений в секунду. |
Maximum | Максимальное количество чтений в секунду. | |
Нагрузка: пропускная способность записи | Average | Среднее количество операций записи в секунду. |
Maximum | Максимальное количество записей в секунду. | |
Нагрузка: пропускная способность RangeSlice | Average | Среднее количество RangeSlices в секунду. |
Maximum | Максимальное количество RangeSlices в секунду. | |
Незавершенные задачи: чтение незавершенных задач | Read pending tasks | Количество задач мутации чтения. |
Отложенные задачи: отложенные задачи ReadRepair | ReadRepair pending tasks | Количество задач изменения ReadRepair. |
Незавершенные задачи: Незавершенные задачи мутации | Mutation pending tasks | Количество задач мутации в очереди. |
Отложенные задачи: сжатие отложенных задач | Compaction tasks pending | Предполагаемое количество уплотнений, которые осталось выполнить. |