Курс обновлен

Observability: мониторинг, логирование, трассировка

Лучшие практики по мониторингу инфраструктуры и отдельных её компонентов: приложения, баз данных, etc.

31 августа

Professional

5 месяцев

Онлайн

Пн/Чт 20:00 Мск

Для кого этот курс?

DevOps инженерам курс поможет быстро выявлять и устранять проблемы в инфраструктуре с помощью мониторинга, логов и трассировки. Также Вы сможете начать создавать метрики и алерты для автоматизации мониторинга, что оптимизирует использование ресурсов и улучшает; пользовательский опыт;
Системным администраторам курс позволит улучшить контроль за инфраструктурой, создавая полноценную систему наблюдаемости для быстрого обнаружения и устранения неполадок;
Разработчикам Backend и FullStack, так как курс позволяет глубже понять поведение приложений в продакшене, что помогает в быстром выявлении и устранении проблем;
Администраторам Linux курс поможет разобраться в разработке комплексного подхода к управлению инфраструктурой.

Вам подойдет курс если необходимо настроить мониторинг, логирование и трейсинг с помощью Prometheus, Grafana, ELK, Tempo.

Что даст вам этот курс?

Никакого хаоса и бессвязных метрик. После курса вы сможете правильно строить системы мониторинга и логирования, что позволит более точно понимать текущее состояние всех систем и быстрее реагировать на инциденты.

Вы научитесь:

строить сложные эффективные системы мониторинга и логирования инфраструктуры и приложений
следить за работой большого количества серверов и работать в связке c Prometheus, Grafana, ELK, etc.
обеспечивать визуализацию метрик и настраивать оповещения о критически важных событиях

Вы рассмотрите следующий стек технологий и инструментов: Prometheus, AlertManager, Grafana, Thanos, VictoriaMetrics, Kube-prometheus-stack, ELK, EFK, Graylog2, Beats, Apache Kafka, Kibana, Loki, Tempo(Jaeger), Vector, Logstas

Курс обновлен!

Мы следим за всеми обновлениями в индустрии и собираем best practices. Теперь в программе 5 новых занятий, для вашего профессионального развития

Процесс обучения

Всё обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Слаке курса, сдача домашних работ и получение обратной связи от преподавателя. Вебинары идут дважды в неделю по 1,5 часа. Все вебинары сохраняются и в записи в вашем личном кабинете.

Best Practice

Эксперты-практики поделятся своим уникальным успешным опытом и разберут с вами рабочие кейсы

Необходимые знания

Знание ОС Linux на уровне администратора

Помощь с трудоустройством

Комплексная система, которая поможет получить выгодные офферы в перспективных проектах

Партнеры

Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должности.

Разместите свое резюме в базе OTUS: так наши партнёры смогут пригласить Вас на собеседование.
Участвуйте в карьерных мероприятиях: там мы разбираемся, как составить резюме.
Бесплатный доступ к сервису для подготовки к собеседованиям в Big Tech.
Закрепите знания на видеоуроках и тренажёрах по самым сложным темам: алгоритмы и структуры данных, System design и другие.

* Информация в этом разделе не предназначена для корпоративного обучения

Мониторинг инфраструктуры

Перспективы направления

Средний уровень зарплат:

95 000 ₽Junior+ специалист

150 000 ₽Middle+ специалист

240 000 ₽Senior специалист

2226

актуальных вакансий

Формат обучения

Интерактивные вебинары

Два занятия по два академических часа в неделю. Доступ к записям и материалам остается навсегда

Проектная работа

Вы закрепите полученные знания проектной работой и сможете уверенно чувствовать себя на собеседованиях

Активное комьюнити

Общайтесь с преподавателями голосом на вебинарах и в Slack группы

Программа

Observability - и что он включает. GAP-stack (Grafana, Prometheus, Alertmanager)

Введение в мониторинг, логирование, трейсинг и алертинг. Рассмотрим основу Gap-стека. Поговорим об устройстве и принципах работы Prometheus, о том, как он собирает метрики и хранит их. Разберем основы работы с PromQl. Рассмотрим Alertmanager, обсудим его устройство и то, как он работает с алертами. Научимся визуализировать метрики с помощью дашбордов в Grafana.

Тема 1: Задачи мониторинга, логирования, трейсинга

Тема 2: Prometheus - как новый виток развития систем мониторинга

Тема 3: Prometheus - Exporters, Service Discovery // ДЗ

Тема 4: Grafana - основной инструмент визуализации данных

Тема 5: Отказоустойчивость Prometheus, хранилища метрик для Prometheus (Thanos, VictoriaMetrics, Mimir) // ДЗ

Тема 6: Prometheus, Alertmanager - работа с метриками (PromQL), написание алертов и их ротация // ДЗ

Тема 7: Grafana - продвинутое использование // ДЗ

Тема 8: Kube-prometheus-stack - мониторинг Kubernetes при помощи Prometheus operator

Тема 9: Q&A сессия по разбору домашних заданий

Zabbix

В данном модуле рассмотрим работу с Zabbix. Его устройство, как собираются и хранятся метрики. Рассмотрим, как создаются алерты и графики по метрикам.

Тема 1: Установка и конфигурация

Тема 2: Мониторинг порталов и баз данных

Тема 3: Настройка алертинга // ДЗ

Тема 4: Discovery Trapper

Тема 5: Графики и комплексные экраны. Q&A по модулю Zabbix

TICK стек

В данном модуле мы рассмотрим набор open source инструментов, которые являются составными частями системы сбора, хранения и визуализации временных рядов.

Тема 1: Telegraf

Тема 2: Хранение временных рядов с InfluxDB

Тема 3: Chronograf как инструмент визуализации метрик

Тема 4: Алертинг с Kapacitor // ДЗ

Централизованные системы логирования. Elastic stack

В данном модуле: - разберем, какие способы логирования существуют - рассмотрим устройство Elastic stack и его задачи - подробно рассмотрим компоненты стека по отдельности.

Тема 1: Классическое логирование в Linux

Тема 2: Построение системы централизованного логирования на основе Elasticsearch, Logstash, Kibana, Beats. Введение в Elasticsearch

Тема 3: Elasticsearch

Тема 4: Beats - инструменты доставки данных // ДЗ

Тема 5: Системы агрегации сообщений Logstash/Vector // ДЗ

Тема 6: Kibana как инструмент визуализации логов

Тема 7: Q&A сессия по разбору домашних заданий

Прочие инструменты для централизованного сбора логов

Рассмотрим систему логирования от компании Grafana, вдохновленную Prometheus подходом к данным; бесплатный форк Elastic stack от Amazon; Open Source систему централизованного логирования Graylog. Рассмотрим роль Apache Kafka как очереди сообщений в схемах систем логирования.

Тема 1: Opensearch // ДЗ

Тема 2: Graylog // ДЗ

Тема 3: Grafana Loki - управление логами и доставка // ДЗ

Тема 4: Apache Kafka в логировании

Тема 5: Введение в SIEM-системы на примере Wazuh

Системы распределенного трейсинга

Разберем систему хранения трейсов Tempo. Рассмотрим систему распределенного трейсинга Zipkin.

Тема 1: Построение распределенного трейсинга на примере Zipkin

Тема 2: OpenTelemetry

Тема 3: Jaeger и Grafana Tempo

Тема 4: Grafana Alloy

Надежность и эксплуатация наблюдаемости

Модуль посвящен практикам обеспечения надежности и устойчивости современных распределенных систем с использованием observability. Вы научитесь формулировать и измерять цели надежности, выстраивать процессы реагирования на инциденты и анализировать деградации сервисов. Также, рассмотрим проверку устойчивости систем через управляемые сбои, архитектуру observability-платформ для крупных инфраструктур и контроль стоимости эксплуатации.

Тема 1: Проектирование SLI, SLO и Error Budget

Тема 2: Реагирование на инциденты и on-call процессы

Тема 3: Chaos Engineering для проверки наблюдаемости

Тема 4: Архитектура observability больших систем

Тема 5: Observability затрат и FinOps

Проектная работа

Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

Тема 1: Консультация по проектам и домашним заданиям // Проект

Тема 2: Защита проектной работы

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Выпускной проект

В рамках выпускного проекта вам предстоит применить все полученные знания на практике. Вы самостоятельно развернете инфраструктуру состоящую из нескольких ВМ и сервисов развернутых на них. Далее вы настроите систему мониторинга, алертинга, логирования.

Преподаватели

Руководитель курса

Иван Федоров

Технический директор

Inotechgroup

Антон Касимов

Анатолий Бень

Олег Нова

Senior DevOps Engineer

Payler

Эрик Арайс

Специалист группы эксплуатации вычислительной систем

Честный знак

Антон Касимов

Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания

Ближайшие мероприятия

Открытый вебинар — это настоящее занятие в режиме онлайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.

OpenTelemetry — наблюдаемость на блюдечке

Антон Касимов

Современные распределённые системы требуют мощных инструментов для Диптихов, отслеживания и логирования. OpenTelemetry стала стандартом де-факто в мировой наблюдаемости, обеспечивая единый подход к сбору метрик, журналов и трейсов.

На этом занятии мы разберемся, как OpenTelemetry помогает добиться полной прозрачности работы сервисов, сократить время на поиск проблем и упростить анализ производительности. Рассмотрим практические ключи внедрения OpenTelemetry в микросервисные структуры и изучим лучшие практики их использования.

Что разберём на вебинаре:

- Как работает OpenTelemetry и почему он стал ключевым стандартом наблюдения (наблюдаемости).
- Какие компоненты входят в OpenTelemetry и как их правильно использовать.
- Как собирать, обрабатывать и визуализировать данные о работе системы.
- Как внедрить OpenTelemetry в микросервисную архитектуру и использовать его с современными инструментами (Grafana, Prometheus, Jaeger, Zipkin и др.).
- Лучшая практика работы с OpenTelemetry для оптимизации Диптихов и устранения аварий.

Кому будет полезно:

- DevOps-инженерам, которые хотят централизованно оценивать наблюдательность за инфраструктурой и сервисами.
- Системным администраторам, заинтересованным в глубоком анализе журналов и метрик.
- Разработчикам Backend, которыми важно понимать производительность сервисов и анализировать поведение запросов.
- Разработчикам FullStack, которые хотят внедрить сквозную трассировку и упрощенную отладку распределённых систем.

Что вы получите:

- Разберётесь в принципах работы OpenTelemetry и его роли в наблюдениях.
- Освоите инструменты и методы сбора журналов, метрик и трейсов.
- Узнайте, как минимизировать время поиска проблем и улучшить сервисы мониторинга.
- Получите готовые решения для руководителей OpenTelemetry в своих проектах....

4 августа в 20:00

Открытый вебинар

Системы логирования: ELK, EFK или Graylog?

Михаил Чугунов

Как выбрать подходящий стек для сбора, хранения и анализа логов. Логи — один из ключевых источников информации о состоянии системы. Но без правильно выбранного инструмента они быстро превращаются в хаотичный поток данных, в котором сложно найти причину проблемы.

На вебинаре сравним популярные системы централизованного логирования, разберём их архитектуру, преимущества и сценарии применения, чтобы вы могли выбрать решение под задачи своей инфраструктуры.

Что разберём на вебинаре:

- Чем отличаются ELK, EFK и Graylog и в каких сценариях каждый стек наиболее эффективен.
- Как устроен процесс сбора, обработки, хранения и поиска логов.
- Как организовать централизованное логирование для мониторинга и диагностики распределённых систем.
- На что обратить внимание при выборе системы логирования для своей инфраструктуры.

Кому будет полезно:

- DevOps- и SRE-инженерам, отвечающим за наблюдаемость и эксплуатацию сервисов.
- Системным администраторам и инженерам сопровождения, работающим с логированием приложений.
- Backend-разработчикам и архитекторам, которым важно быстро находить причины сбоев и анализировать поведение систем.

Что вы получите:

- Понимание сильных и слабых сторон ELK, EFK и Graylog.
- Навык выбора подходящего решения под задачи проекта и инфраструктуры.
- Представление о лучших практиках построения централизованной системы логирования.
- Понимание того, как использовать логи для ускорения диагностики и повышения наблюдаемости сервисов.

Если вы хотите перестать искать ошибки вручную и построить систему логирования, которая действительно помогает находить проблемы, — этот вебинар для вас....

17 августа в 20:00

Открытый вебинар

Прошедшие
мероприятия

Анатолий Бень

Открытый вебинар

Grafana Stack - закрываем все современные потребности Observability

Антон Касимов

Открытый вебинар

Поиск и устранение проблем в системе мониторинга Zabbix

Для доступа ко всем прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Этот курс может оплатить ваш работодатель

Обучайтесь за счёт работодателя или разделите оплату 50/50

Подробно расскажем об интересующем вас курсе
Объясним, как договориться с работодателем
Сообщим стоимость обучения и варианты оплаты
Ответим на вопросы
Предоставим шаблон договора и счёт на оплату

Подробнее о корпоративном обучении

Отзывы

Камар Чаубаева

26.12.2025

На курс я попала по рекомендации и поддержке моего работодателя — банка, в котором я работаю. Для меня это была отличная возможность глубже разобраться в теме мониторинга и логирования, которая напрямую связана с моей профессиональной деятельностью. Признаюсь, в период обучения у меня было немного ограничено время, поэтому не всегда удавалось полноценно погружаться в каждое занятие. Но, несмотря на это, я старалась максимально включаться в процесс и проходить материалы. Огромным плюсом является то, что у меня остаётся доступ к курсу, и я планирую возвращаться к урокам, пересматривать их и продолжать практиковаться уже в более спокойном режиме. Курс помог структурировать знания и лучше понять, как работают инструменты мониторинга, логирования и трассировки. Многие вещи стали гораздо более ясными — как с точки зрения теории, так и практического применения. Это однозначно усилило мою профессиональную уверенность. В целом обучение оставило очень положительное впечатление. Возможно, иногда хотелось бы немного больше времени на практику внутри занятий, но, с другой стороны, возможность возвращаться к материалам это компенсирует. Спасибо команде Otus за продуманный курс и подачу материала 🙏

Данила Саловский

29.01.2025

Работаю DevOps-инженером. Хотел улучшить свои знания и навыки, которые непосредственно связаны с моей профессией. Понравилось, что лекции проходят в очном формате, можно сразу задать вопросы преподавателю, для меня это был один из ключевых факторов в выборе платформы обучения. Достаточно комфортный график обучения. Казалось бы, мелочь, но возможность загрузить расписание лекций в календарь на деле весьма полезна. Процесс геймификации оказался интересным и вовлекающим в обучение занятием. Хотелось бы добавить побольше домашних заданий, т.к. не по всем темам они были. Например, даже не практическое задание, а на проверку теории явно помогло бы улучшить усвоение пройденного материала. В «компании мечты» я уже работаю, но пройденное обучение точно позволит мне применить полученные знания и навыки для повышения наблюдаемости в инфраструктуре, улучшить существующие процессы и в результате получить достойную оценку моих компетенций

Әкім Аблаким

16.01.2025

курсы топ 5 из 5 все четко доступно и понятно спасибо OTUS

Владимир Захаров

08.08.2024

Очень объемный и интересный курс в плане глубины и количества информации. Затрагивается все самые популярные методы мониторинга. Задания насыщенные, придется посидеть, но этого того стоит. Спасибо.

Дмитрий Жигунов

06.08.2024

Курс помог систематизировать и расширить знания по знакомым продуктам, познакомил с новыми решениями в области мониторинга. Понравились живые практические примеры, хорошая подача материала.

Матвей Малков

09.03.2023

Сейчас, как и до обучения на курсе, работаю прикладным администратором и сопровождаю банковские системы. Курс по Мониторингу я выбрал, так как данная тема стала актуальна на работе и возникла необходимость в получении структурированных знаний. За время обучения в Otus мне больше всего понравилась актуальная программа и очень крутой преподавательский состав. По итогу курса, получилось настроить мониторинг, алертинг и логи в эластик на прод системе, благодаря чему стало чуть легче жить

Подтверждение знаний и навыков

OTUS осуществляет лицензированную образовательную деятельность.
В конце обучения вы получите сертификат OTUS о прохождении курса

После обучения:

заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач), получите сертификат о прохождении курса
разовьете практические навыки в решении задач мониторинга и построите собственную систему мониторинга
получите глубокое представление о Prometheus, Grafana, ELK
обеспечите визуализацию метрик и настроите оповещения о критически важных событиях

Observability: мониторинг, логирование, трассировка

В рассрочку

Полная

Компаниям

Стоимость в рассрочку

от 8 083,33 ₽/мес

Доступные способы оплаты.
Стоимость указана для оплаты физическими лицами

Верните с помощью налогового
вычета до 13% стоимости обучения. Пройдите тестирование и менеджер вас проконсультирует

Есть вопросы? Позвоните!
+7 499 938-92-02 бесплатно

Пройдите тестирование

Старт занятий 31 августа

Доступные способы оплаты.
Стоимость указана для оплаты физическими лицами

Есть вопросы? Позвоните!
+7 499 938-92-02 бесплатно

Частые вопросы

Что если в середине курса я не смогу продолжать обучение?

У вас есть право одного бесплатного трансфера в другую группу.

Обязательно ли защищать проектную работу?

Для получения сертификата OTUS необходимо сдать проект. Кроме того, проект необязательно защищать перед аудиторией, а можно сдать в чате с преподавателем.

С какого момента я могу заниматься трудоустройством?

Получить карьерную консультацию вы сможете уже в начале обучения. Остальные опции: помощь с резюме, добавление резюме в нашу базу специалистов и т.д. становятся доступны после выпуска.

Я могу вернуть деньги?

Да, мы можем вернуть деньги за то время курса, которое вы ещё не успели отучиться. Например, если курс длится пять месяцев, а вы отучились один, мы вернём деньги за оставшиеся четыре месяца за вычетом фактически понесенных расходов.

Observability: мониторинг, логирование, трассировка

Для кого этот курс?

Что даст вам этот курс?

Вы научитесь:

Курс обновлен!

Процесс обучения

Best Practice

Необходимые знания

Помощь с трудоустройством

Партнеры

Мониторинг инфраструктуры

Формат обучения

Интерактивные вебинары

Проектная работа

Активное комьюнити

Программа

Observability - и что он включает. GAP-stack (Grafana, Prometheus, Alertmanager)

Zabbix

TICK стек

Централизованные системы логирования. Elastic stack

Прочие инструменты для централизованного сбора логов

Системы распределенного трейсинга

Надежность и эксплуатация наблюдаемости

Проектная работа

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Выпускной проект

Преподаватели

Ближайшие мероприятия

Прошедшие мероприятия

Этот курс может оплатить ваш работодатель

Отзывы

Подтверждение знаний и навыков

После обучения:

Observability: мониторинг, логирование, трассировка

Частые вопросы

Что если в середине курса я не смогу продолжать обучение?

Обязательно ли защищать проектную работу?

С какого момента я могу заниматься трудоустройством?

Я могу вернуть деньги?

Прошедшие
мероприятия