Зачем нужен мониторинг оборудования?

Нередко бывает, что программы ломаются, а серверы падают. Вряд ли этого можно избежать со 100%-ной вероятностью. Скачок напряжения, случайный баг, сбои в подаче электроэнергии — эти и многие другие факторы способны вызвать поломки. Минимизировать вероятность появления проблемы поможет мониторинг.

Мониторинг предполагает сбор и анализ разных параметров поведения системы. Благодаря мониторингу вы сможете описать каждый важный аспект вашего проекта и измерить его в числовом выражении.

У современного мониторинга есть несколько уровней. В этой статье мы поговорим про самый нижний — мониторинг оборудования

Особенности мониторинга оборудования

Как правило, серверы располагаются в дата-центре, причём у них есть конкретные параметры и показатели производительности. Данные параметры следует мониторить в первую очередь, делая это на каждом сервере, который обслуживает ваших клиентов.

Вас должны интересовать: • нагрузка на процессор; • свободное место на жёстком диске и в оперативной памяти; • нагрузка на сеть; • нагрузка на жесткий диск (имеется в виду число операций на чтение и запись); • количество задач, которые запущены на исполнение.

Вышеупомянутый перечень очевиден. Регулярно отслеживать эти значения — значит вовремя диагностировать и предотвратить множество неприятных ситуаций, способных стать причиной полного либо частичного коллапса инфраструктуры со всеми вытекающими отсюда репутационными и финансовыми потерями.

На что стоит обратить особое внимание:

  1. Нагрузка близка к критической, железо на грани отказа (возможно, пришло время масштабироваться).
  2. Вы выкатили новый релиз, но как-то подозрительно быстро закончилась память (ситуация из серии «нас опять взломали!»).
  3. Вы ничего не выкатывали, однако после очередной рекламной кампании скачкообразно повысилось число клиентов, поэтому скоро всё упадет.

Чтобы анализировать поведение серверов в простейшем виде, вполне подходят штатные средства контроля типа htop. Если же интересует более гибкое и масштабируемое решение, можно воспользоваться Zabbix, который уже способен анализировать главные параметры целого кластера серверов, а также собирать их в единой панели. Но это решение уже потребует настроек, выполнить которые может квалифицированный системный администратор.

Что касается пользователей контейнерных систем, то тут для мониторинга вполне подойдёт штатный Kubernetes Dashboard (инструмент, поставляемый вместе с Kubernetes).

На этом пока всё, успешного вам мониторинга!

Статья подготовлена по материалам блога MCS.Mail.ru.