Промокод SRE_En_11
Лучшие практики по управлению надежностью, доступностью и эффективностью сервисов
Professional
Онлайн

Site Reliability Engineering - это подход к организации эксплуатации информационных систем.
SRE подход переосмысливает задачи, которые исторически выполнялись операторами и системными администраторами, часто вручную, и передает их операционным группам, которые используют программное обеспечение и автоматизацию для решения проблем эксплуатации и управления системами.
Подход решает задачу управления надежностью используя набор техник: принятие решений на основе данных о состоянии системы, работа с инцидентами и усовершенствованные регламенты, работа со стейкхолдерами и управление ожиданиями и конечно же разумная автоматизация происходящего.
SRE - это прежде всего практики создания масштабируемых и высоконадежных программных систем.
Практические домашние задания для закрепления теории выполняются на базе следующего технологического стека: Linux, Kubernetes, Ansible, Terraform, Prometheus, Python.
Проработка теории в домашних заданиях
Опытные спикеры, которые работают в ведущих компаниях
Индивидуальная разработка итоговой проектной работы
Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должности.
2 онлайн-трансляции по 2 ак.часа в неделю. Доступ к записям и материалам остается навсегда
Домашние задания + проектная работа, для усиления вашего портфолио и компетенций
Общайтесь с преподавателями голосом на вебинарах, в закрытом чате Telegram и при проверке домашних заданий
В первом модуле рассматриваются основные принципы SRE
Тема 1: Введение в SRE // ДЗ
Тема 2: Основные принципы SRE
Тема 3: SLI, SLA, SLO и управление рисками // ДЗ
Второй модуль посвящен рассмотрению практик управления различными конфигурациями
Тема 1: Практика управление конфигурацией. Ansible // ДЗ
Тема 2: Практика управление конфигурацией. Terraform // ДЗ
В третьем модуле наибольшее внимание будет уделено экосистеме Kubernetes
Тема 1: Экосистема Kubernetes // ДЗ
Тема 2: Практика управление конфигурацией. Helm // ДЗ
Тема 3: QA-сессия
В данном модуле рассмотрим различные аспекты автоматизации в контексте SRE
Тема 1: Автоматизация: CLI, Data transformation // ДЗ
Тема 2: Aвтоматизация: Runbook Automation (Jenkins/AWX/Rundeck) // ДЗ
Тема 3: Автоматизация: Low-Code/No-Code
В данном модуле будут рассмотрены и проанализированы различные аспекты мониторинга в контексте SRE
Тема 1: Observability: мониторинг и алертинг // ДЗ
Тема 2: Observability: логирование // ДЗ
Тема 3: Observability: трейсинг и визуализация // ДЗ
Шестой модуль нацелен комплексно ознакомить с различными практиками SRE подхода
Тема 1: Непрерывная поставка и управление изменениями // ДЗ
Тема 2: Управление релизами
Тема 3: Практика on-call и жизненный цикл SRE команды
Тема 4: QA-сессия
Тема 5: Практика постмортемов
Тема 6: Тестирование надежности систем // ДЗ
Тема 7: Практика диагностики и решения проблем // ДЗ
Тема 8: Управление нагрузкой предотвращения перегрузок и сбоев // ДЗ
Тема 9: Customer Reliability Engineering
В данном модуле будет детально рассмотрено обеспечение надежность микросервисов и контроль за SLO. Также на условиях приближенных к реальным будет отработано реагирование на инцидент.
Тема 1: Знакомство с системой, деплой и определение SLO в K8s // ДЗ
Тема 2: Наблюдаемость в Kubernetes: Мониторинг и трейсинг // ДЗ
Тема 3: Нагрузочное тестирование, автоскейлинг и анализ последствий // ДЗ
Тема 4: Симуляция инцидента и отработка процедур восстановления // ДЗ
Заключительный месяц курса посвящен проектной работе. Проект – это самая интересная часть обучения. Вы будете разрабатывать его на основе полученных на курсе навыков и компетенций. В процессе работы над проектом можно получить консультацию преподавателей.
Тема 1: Выбор темы и организация проектной работы // Проект
Тема 2: Консультация по проектам и домашним заданиям - промежуточная приемка
Тема 3: Защита проектных работ
Пример выпускного проекта - читайте в нашем блоге:
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
OTUS осуществляет лицензированную образовательную деятельность.
В конце обучения вы получите сертификат OTUS о прохождении курса