Инструменты для мониторинга кластеров Kubernetes

Как известно, мониторинг и логирование позволяют поддерживать работоспособность современной IT-инфраструктуры. Если же речь идёт о микросервисной архитектуре, то мониторинг приобретает ещё большую важность. И это очевидно, ведь когда компонентов больше, больше и зависимостей, не говоря уже о повышенных требованиях к отказоустойчивости.

В этой статье поговорим о нескольких самых популярных решениях для мониторинга кластеров Kubernetes. Решения подобраны с учётом простоты установки, доступности и, разумеется, наличия соответствующего функционала (мониторинг+логи+алерты).

Решение № 1. Prometheus + InfluxDB + Grafana

Популярный стек, где используются: — для сбора метрик — Prometheus; — для обработки данных — InfluxDB; — для представления графиков и схем — Grafana.

Prometheus известен давно и является, по сути, стандартным инструментом по сбору метрик в Кубере, что касается представления данных, то вряд ли что-то можно противопоставить Grafana.

Инсталляция компонентов производится через Helm, поэтому с этим проблем нет. Но нужно учесть, что применить их сразу «из коробки» не выйдет — надо будет немного поработать над конфигурацией. Из плюсов: Grafana уже включает в себя ряд dashboards для мониторинга, что не может не радовать.

В плане доступности тоже всё прекрасно, т. к. компоненты распространяются по свободной лицензии.

Что же можно сказать в плане мониторинга? В целом, всё неплохо: стек мониторит состояние контейнеров, получает информацию о загруженности нодов (CPU, RAM), используя для этого понятный и удобный пользовательский интерфейс. Плюс ко всему, Prometheus предоставляет доступ к большому числу метрик, однако в случае надобности можно подключить и свои.

Идём дальше — алерты. С ними тоже всё хорошо: у Prometheus есть встроенный модуль alertmanager, который вы можете настроить или через файлы конфигурации, или через графический интерфейс, но он, мягко говоря, не очень удобен.

Теперь ложечка дёгтя: у рассматриваемого стека нет возможности работать с логами, а это уже серьёзный минус.

Решение № 2. Prometheus + ELK stack (ElasticSearch + Logstash + Kibana)

Тоже популярный стек со знакомым Prometheus, однако здесь для индексации данных используется ElasticSearch, для отображения метрик — Kibana, а для управления логами — Logstash. Решение гибкое, но сложное в конфигурировании.

Установку нельзя назвать слишком простой. Здесь нет готовых дашбордов для Kubernetes, поэтому будьте готовы потратить время при их настройке в Kibana. Но когда всё будет готово, управлять ими станет весьма удобно. Также стоит добавить, что, как и в предыдущем стеке, компоненты инсталлируются с помощью Helm.

Теперь о доступности. Компоненты бесплатны и являются open source. Хоть Elasticsearch и доступен в качестве платного онлайн-сервиса (SaaS), но всё же дешевле применять его на собственных вычислительных ресурсах. Это так, к слову.

Далее перейдём к возможностям мониторинга. А они, по сути, безграничны. Kibana предоставляет доступ к множеству графиков и дашбордов, то есть вы сможете просматривать почти всё, что связано с состоянием кластера. Остаётся добавить, что Prometheus собирает много метрик и, как и в предыдущем случае, всегда можно задействовать дополнительные экспортеры.

Следующий плюс — логи. Вообще, управление логами — одна из главных областей применения ELK. Имеющихся возможностей вам хватит для решения большинства задач: стек обеспечит фильтрацию, корреляцию с ошибками, группировку логов и так далее.

Можно настроить и алерты. Это делается так: — применяем модуль alertmanager в Prometheus; — применяем ElasticSearch Watcher в рамках X-Pack-модуля. Он даёт возможность легко настраивать оповещения, но тут следует учесть, что его придётся инсталлировать отдельно, т. к. он не включён в стандартную поставку.

Пожалуй, на этом всё. Подробнее о мониторинге и логировании вы всегда можете узнать на нашем курсе.

Статья написана по материалам блога mcs.mail.ru.