Специальная цена
Курс обновлен
Observability: мониторинг, логирование, трейсинг
Best Practice по мониторингу инфраструктуры и отдельных её компонентов: приложения, баз данных, etc.
24 марта
Professional
4 месяца
Онлайн
Пн/Чт 20:00 Мск
Для кого этот курс?
- DevOps инженерам курс поможет быстро выявлять и устранять проблемы в инфраструктуре с помощью мониторинга, логов и трассировки. Также Вы сможете начать создавать метрики и алерты для автоматизации мониторинга, что оптимизирует использование ресурсов и улучшает; пользовательский опыт;
- Системным администраторам курс позволит улучшить контроль за инфраструктурой, создавая полноценную систему наблюдаемости для быстрого обнаружения и устранения неполадок;
- Разработчикам Backend и FullStack, так как курс позволяет глубже понять поведение приложений в продакшене, что помогает в быстром выявлении и устранении проблем;
- Администраторам Linux курс поможет разобраться в разработке комплексного подхода к управлению инфраструктурой.
Вам подойдет курс если необходимо настроить мониторинг, логирование и трейсинг с помощью Prometheus, Grafana, ELK, Tempo.
Что даст вам этот курс?
Никакого хаоса и бессвязных метрик. После курса вы сможете правильно строить системы мониторинга и логирования, что позволит более точно понимать текущее состояние всех систем и быстрее реагировать на инциденты.
Вы научитесь:
- строить сложные эффективные системы мониторинга и логирования инфраструктуры и приложений
- следить за работой большого количества серверов и работать в связке c Prometheus, Grafana, ELK, etc.
- обеспечивать визуализацию метрик и настраивать оповещения о критически важных событиях
Курс обновлен!
Мы следим за всеми обновлениями в индустрии и собираем best practices. Теперь в программе 5 новых занятий, для вашего профессионального развития
Процесс обучения
Best Practice
Эксперты-практики поделятся своим уникальным успешным опытом и разберут с вами рабочие кейсы
Необходимые знания
Знание ОС Linux на уровне администратора
Помощь с трудоустройством
Комплексная система, которая поможет получить выгодные офферы в перспективных проектах
Партнеры
- Разместите свое резюме в базе OTUS: так наши партнёры смогут пригласить Вас на собеседование
- Посещайте карьерные мероприятия OTUS: Вам расскажут, как лучше приходить собеседование
Мониторинг инфраструктуры
Формат обучения
Интерактивные вебинары
Два занятия по два академических часа в неделю. Доступ к записям и материалам остается навсегда
Проектная работа
Вы закрепите полученные знания проектной работой и сможете уверенно чувствовать себя на собеседованиях
Активное комьюнити
Общайтесь с преподавателями голосом на вебинарах и в Slack группы
Программа
Observability - и что он включает. GAP-stack (Grafana, Prometheus, Alertmanager)
Введение в мониторинг, логирование, трейсинг и алертинг. Рассмотрим основу Gap-стека. Поговорим об устройстве и принципах работы Prometheus, о том как он собирает метрики и хранит их. Разберем основы работы с PromQl. Рассмотрим Alertmanager, обсудим его устройство и то как он работает с алертами. Научимся визуализировать метрики с помощью дашбордов в Grafana
Тема 1: Задачи мониторинга, логирования, трейсинга
Тема 2: Prometheus - как новый виток развития систем мониторинга
Тема 3: Prometheus - Exporters, Service Discovery // ДЗ
Тема 4: Grafana - основной инструмент визуализации данных
Тема 5: Отказоустойчивость Prometheus, хранилища метрик для Prometheus (Thanos, VictoriaMetrics, Mimir) // ДЗ
Тема 6: Prometheus, Alertmanager - работа с метриками (PromQL), написание алертов и их ротация // ДЗ
Тема 7: Grafana - продвинутое использование // ДЗ
Тема 8: Kube-prometheus-stack - мониторинг Kubernetes при помощи Prometheus operator
Тема 9: Q&A сессия по разбору домашних заданий
Zabbix
В данном модуле рассмотрим работу с Zabbix. Его устройство, как собираются и хранятся метрики. Рассмотрим как создаются алерты и графики по метрикам
Тема 1: Установка и конфигурация
Тема 2: Мониторинг порталов и баз данных
Тема 3: Настройка алертинга // ДЗ
Тема 4: Discovery Trapper
Тема 5: Графики и комплексные экраны. Q&A по модулю zabbix
TICK стек
В данном модуле мы рассмотрим набор open source инструментов которые являются составными частями системы сбора, хранения и визуализации временных рядов.
Тема 1: Telegraf
Тема 2: Хранение временных рядов с InfluxDB
Тема 3: Chronograf как инструмент визуализации метрик
Тема 4: Алертинг с Kapacitor // ДЗ
Логирование
В данном модуле: - разберем какие способы логирования существуют - сравним популярные стеки для логирования (Elastic stack, Opensearch, Loki, Graylog), разберемся чем они отличаются.
Тема 1: Классическое логирование в Linux
Тема 2: Централизованные системы логирования
Elastic stack
В данном модуле: - рассмотрим устройство стека и его задачи - подробно рассмотрим компоненты стека по отдельности.
Тема 1: Построение системы централизованного логирования на основе Elasticsearch, Logstash, Kibana, Beats. Введение в Elasticsearch
Тема 2: Elasticsearch
Тема 3: Beats - инструменты доставки данных // ДЗ
Тема 4: Системы агрегации сообщений Logstash/Vector // ДЗ
Тема 5: Kibana как инструмент визуализации логов
Тема 6: Q&A сессия по разбору домашних заданий
Системы централизованного логирования
- Рассмотрим систему логирования от компании Grafana, вдохновленную Prometheus подходом к данным; - Бесплатный форк Elastic stack от Amazon; - Opensource систему централизованного логирования Graylog; - Рассмотрим роль Apache Kafka как очереди сообщений в схемах систем логирования.
Тема 1: Grafana Loki - управление логами и доставка // ДЗ
Тема 2: Opensearch // ДЗ
Тема 3: Graylog // ДЗ
Тема 4: Apache Kafka в логировании
Системы распределенного трейсинга
- Разберем систему хранения трейсов Tempo - Подробно рассмотрим систему распределенного трейсинга Zipkin
Тема 1: Построение распределенного трейсинга на примере Zipkin
Тема 2: Jaeger и Grafana Tempo
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей
Тема 1: Консультация по проектам и домашним заданиям
Тема 2: Защита проектной работы // Проект
Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит
Выпускной проект
В рамках выпускного проекта вам предстоит применить все полученные знания на практике. Вы самостоятельно развернете инфраструктуру состоящую из нескольких ВМ и сервисов развернутых на них. Далее вы настроите систему мониторинга, алертинга, логирования.
Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Ближайшие мероприятия
Открытый вебинар — это настоящее занятие в режиме онлайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
На этом занятии мы разберемся, как OpenTelemetry помогает добиться полной прозрачности работы сервисов, сократить время на поиск проблем и упростить анализ производительности. Рассмотрим практические ключи внедрения OpenTelemetry в микросервисные структуры и изучим лучшие практики их использования.
На вебинаре вы узнаете:
1. Как работает OpenTelemetry и почему он стал ключевым стандартом наблюдения (наблюдаемости).
2. Какие компоненты входят в OpenTelemetry и как их правильно использовать.
3. Как собирать, обрабатывать и визуализировать данные о работе системы.
4. Как внедрить OpenTelemetry в микросервисную архитектуру и использовать его с современными инструментами (Grafana, Prometheus, Jaeger, Zipkin и др.).
5. Лучшая практика работы с OpenTelemetry для оптимизации Диптихов и устранения аварий.
Вебинар будет полезен:
• DevOps-инженерам, которые хотят централизованно оценивать наблюдательность за инфраструктурой и сервисами.
• Системным администраторам, заинтересованным в глубоком анализе журналов и метрик.
• Разработчикам Backend, которыми важно понимать производительность сервисов и анализировать поведение запросов.
• Разработчикам FullStack, которые хотят внедрить сквозную трассировку и упрощенную отладку распределённых систем.
В результате вебинара:
1. Разберётесь в принципах работы OpenTelemetry и его роли в наблюдениях.
2. Освоите инструменты и методы сбора журналов, метрик и трейсов.
3. Узнайте, как минимизировать время поиска проблем и улучшить сервисы мониторинга.
4. Получите готовые решения для руководителей OpenTelemetry в своих проектах.
На этом занятии мы разберем архитектурные подходы к построению масштабируемого мониторинг, выберем инструменты, которые справляются с большими нагрузками, и рассмотрим методы оптимизации сбора, хранения и анализа метрик.
Особенности вебинара / На вебинаре вы узнаете:
1. Какие проблемы мониторинга высонагруженных систем могут возникнуть
2. Какие инструменты и базы данных подходят для сбора и хранения больших объемов метрик (Prometheus, VictoriaMetrics, Mimir, Thanos и др.).
3. Как масштабировать мониторинг: федерация, шардинг, агрегация и сэмплирование данных.
4. Как минимизировать нагрузку на систему и сократить расходы на хранение данных.
5. Практические кейсы организации в своих highload-проектах.
Вебинар будет полезен:
- DevOps-инженерам
- Системным администраторам
- Разработчикам Backend
- Разработчикам FullStack
- Инженерам по безопасности
В результате вебинара:
1. Освоите принципы построения систем мониторинга в высоконагруженных распределительных проектах.
2. Узнайте, какие инструменты лучше всего подходят для обработки потоков больших данных.
3. Вы можете настроить эффективный сбор, хранение и анализ данных поступающих из систем мониторинга.
4. Оптимизировать мониторинг в своих проектах, снизить нагрузку на инфраструктуру и ускорить выявление проблем.
На вебинаре вы узнаете:
1. Как Grafana Alloy помогает унифицировать доставку журналов, метрик и трейсов в сложных инфраструктурах.
2. Чем Alloy отличается от других агентов по сбору данных , таких как Fluentd, Fluent Bit и Vector.
3. Как правильно настроить Alloy для работы с Прометеем, Локи, Темпо и другими инструментами.
4. Как обеспечить отказоустойчивость и балансировку нагрузки при передаче данных.
5. Лучшие методы фильтрации, трансформации и маршрутизации данных для оценки эффективности Диптихов.
Вебинар будет полезен:
• DevOps-инженерам и разработчикам, которые хотят постепенного управления телеметрией и соблюдения принципов наблюдения.
• Системным администраторам, занимающимся централизованным сбором журналов и метрик в распределенной системе.
• Разработчикам Backend, этим важно понимать, как сервисы генерируют логи и метрики, и как их эффективно собирать.
• Разработчикам FullStack, интегрирующим мониторинг и трассировку в приложениях для повышения отказоустойчивости.
В результате вебинара:
5. Вы разберётесь в основных возможностях Grafana Alloy и его месте в экосистеме Observability.
6. Узнайте, как легко интегрировать Alloy с Прометеем, Локи, Темпо и другими инструментами.
7. Освоите преобразование и оптимизацию сбора данных для приложений «Диктоптих» и аналитики.
8. Можно развернуть централизованный сбор журналов, метрик и трейсов, улучшить стабильность и управляемость работы.
Прошедшие
мероприятия
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Корпоративное обучение для ваших сотрудников
- Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
- Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
- OTUS проверяет знания студентов перед стартом обучения и после его завершения
- Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
- Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
- OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год
Отзывы
Подтверждение знаний и навыков
OTUS осуществляет лицензированную образовательную деятельность.
В конце обучения вы получите сертификат OTUS о прохождении курса

После обучения:
- заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач), получите сертификат о прохождении курса
- разовьете практические навыки в решении задач мониторинга и построите собственную систему мониторинга
- получите глубокое представление о Prometheus, Grafana, ELK
- обеспечите визуализацию метрик и настроите оповещения о критически важных событиях
Observability: мониторинг, логирование, трейсинг
Полная стоимость со скидкой
Стоимость указана для оплаты физическими лицами
вычета до 13% стоимости обучения. Пройдите тестирование и менеджер вас проконсультирует
+7 499 938-92-02 бесплатно