SRE практики и инструменты: решение проблемы надежности и доступности сервисов

Курсы

Программирование
Highload Architect Node.js Developer React.js Developer Java Developer. Professional Android Developer. Basic Microservice Architecture Специализация Java-разработчик C++ Developer. Basic Специализация Fullstack developer JavaScript Developer. Professional Unity Game Developer. Basic Framework Laravel Алгоритмы и структуры данных Специализация PHP Developer C# Developer. Professional C# Developer. Basic Буткемп Frontend Developer Golang Developer. Professional iOS Developer. Basic Специализация Python Developer Архитектура и шаблоны проектирования MS SQL Server Developer Software Architect Rust Developer Базы данных Разработчик на Spring Framework Vue.js разработчик Разработчик IoT Подготовка к сертификации Oracle Java Programmer (OCAJP) Unity Game Developer. Professional PostgreSQL Cloud Solutions VR/AR - разработчик
Специализации Курсы в разработке Подготовительные курсы Подписка
+7 499 938-92-02
Курс переработан
Курс переработан

SRE практики и инструменты

Научим как ориентироваться в SRE и разъяснить их принципы коллегам. И расскажем как выстраивать SRE-процессы

Длительность обучения:

5 месяцев

4 ак. часа в нед.

Формат:

Online

Начало занятий:

27 июля

Дни занятий:

Пн 20:00, Ср 20:00

Что даст вам этот курс

Site Reliability Engineering - это подход к организации IT Operations. 
Команды SRE используют программное обеспечение как инструмент для управления системами, решения проблем и автоматизации операционных задач.

SRE берет на себя задачи, которые исторически выполнялись операторами и системными администраторами, часто вручную, и вместо этого передает их операционным группам, которые используют программное обеспечение и автоматизацию для решения проблем и управления системами.

SRE - это практики создания масштабируемых и высоконадежных программных систем. SRE помогает управлять большими системами с помощью подхода "инфраструктура как код (IaC)", который является масштабируемым, самодокументируемым и воспроизводимым, позволяющим управлять тысячами компьютеров силами нескольких специалистов.

Курс подойдет для:

- Разработчиков, которые хотят получить дополнительные компетенции для работы в production окружениях
- Системных инженеров, в задачи которых входит обеспечение надежности и доступности
- Инфраструктурных и платформенных инженеров, которые начали предоставлять свои сервисы другим командам
- Техническим директорам, руководителям и тимлидам, которые хотят разобраться и внедрить SRE практики и инструменты

На курсе вы узнаете, как:

- Что такое SRE и SRE-практики
- Как внедрить SRE практики в своей организации
- Как управлять надежностью, доступностью и эффективностью сервисов
- Управлять изменениями
- Осуществлять мониторинг и улучшать наблюдаемость системы
- Реагировать на инциденты и проблемы с производительностью

Практические задания будем выполнять на базе следующего технологического стека: 
- Linux, Yandex Cloud, Kubernetes, Ansible, Terraform, Prometheus, Python.


По окончании курса вы будете:

- Ориентироваться в SRE-практиках и инструментах
- Уметь разъяснить SRE-принципы коллегам
- Понимать как выстраивать SRE-процессы в контексте взаимодействия с другими отделами компании
- Сможете применять полученные знания в своей ежедневной работе, улучшая жизнь себе, коллегам, проекту и компании

Открытый урок "Как из инженера службы поддержки стать SRE", 7 июля в 20:00
Ведет
Анатолий
Бурнашев
Предыдущий открытый вебинар
Открытый урок "GIT 101: совместная работа, CI, вендоринг", 19 июля в 20:00
На открытом уроке поговорим про основы git, как и какой git выбрать, как начать работать.

Рассмотрим командная работу в git, git flow, pull реквесты. Вендоринг. Теги, релизы и сборка кода.
Валерий
Безруков
Предыдущий открытый вебинар

Преподаватели

Сергей Караткевич

Помогаю людям понять что именно делают компьютеры
Работал в финтехе, телекоме, разработке игр, последние годы в бизнес и технологическом консалтинге.
Мои сильные стороны - планирование, разработка, деплоймент и отладка гетерогенных окружений, взаимодействие с бизнесом и клиентами.

Стек: Linux, Ansible, Terraform, инфраструктура уровня датацентра

Сергей Караткевич

Анастасия Порхун

В индустрии с 2012 года.

Имеет опыт работы в телеком- и аутсорс- компаниях, с государственными структурами. Занимается проектированием и разработкой ПО, выстраиванием процессов CI/CD, а также исследованиями в сфере информационной безопасности.

Считаю, что программировать стоит с использованием языка, стек технологий необходимо продумывать под задачу, а безопасность должна обеспечиваться на всех этапах жизненного цикла ПО.

Анастасия Порхун

Анатолий Бурнашев

Эксперт Центра практик обеспечения надёжности в MTS.Digital

20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Анатолий Бурнашев

Эксперт Центра практик обеспечения надёжности в MTS.Digital

Дмитрий Жиляев

average devops enjoyer

Работал в Selectel и Rabota.ru

Поймал волну helm и создал helmwave

Дмитрий Жиляев

Валерий Безруков

Google Cloud Practice Delivery Manager в EPAM Systems
В прошлом SRE & DevOps team lead в Intelligent Blockchain Labs.

Разрабатывал и поддерживал гибридные облачные и высоконагруженные системы (Google Cloud Platform, OpenStack, Hashicorp Terraform)

Занимался развертыванием, эксплуатацией и поддержкой CI/CD (GitLab CI, Hashicorp Nomad, Kubernetes).

Опыт со следующим стеком технологий : Kubernetes/Docker
, Unix/Solaris/Linux, OpenStack, Oracle/PostgreSQL/Hadoop, Google Cloud Platform

Валерий Безруков

Преподаватели

Сергей Караткевич

Помогаю людям понять что именно делают компьютеры
Работал в финтехе, телекоме, разработке игр, последние годы в бизнес и технологическом консалтинге.
Мои сильные стороны - планирование, разработка, деплоймент и отладка гетерогенных окружений, взаимодействие с бизнесом и клиентами.

Стек: Linux, Ansible, Terraform, инфраструктура уровня датацентра

Сергей Караткевич

Анастасия Порхун

В индустрии с 2012 года.

Имеет опыт работы в телеком- и аутсорс- компаниях, с государственными структурами. Занимается проектированием и разработкой ПО, выстраиванием процессов CI/CD, а также исследованиями в сфере информационной безопасности.

Считаю, что программировать стоит с использованием языка, стек технологий необходимо продумывать под задачу, а безопасность должна обеспечиваться на всех этапах жизненного цикла ПО.

Анастасия Порхун

Анатолий Бурнашев

Эксперт Центра практик обеспечения надёжности в MTS.Digital

20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Анатолий Бурнашев

Эксперт Центра практик обеспечения надёжности в MTS.Digital

Дмитрий Жиляев

average devops enjoyer

Работал в Selectel и Rabota.ru

Поймал волну helm и создал helmwave

Дмитрий Жиляев

Валерий Безруков

Google Cloud Practice Delivery Manager в EPAM Systems
В прошлом SRE & DevOps team lead в Intelligent Blockchain Labs.

Разрабатывал и поддерживал гибридные облачные и высоконагруженные системы (Google Cloud Platform, OpenStack, Hashicorp Terraform)

Занимался развертыванием, эксплуатацией и поддержкой CI/CD (GitLab CI, Hashicorp Nomad, Kubernetes).

Опыт со следующим стеком технологий : Kubernetes/Docker
, Unix/Solaris/Linux, OpenStack, Oracle/PostgreSQL/Hadoop, Google Cloud Platform

Валерий Безруков

Необходимые знания


- Опыт из разработки, тестирования или эксплуатации
- Будет плюсом один из пройденных курсов по разработке в ОТУС
- Будет плюсом пройденные курсы по DevOps практикам и инструментам и Linux
Корпоративное обучение для ваших сотрудников
>
Программа обучения
В процессе обучения вы получите комплексные знания и навыки.
C 27 июля
Тема 1. Введение в SRE // ДЗ
Тема 2. Основные принципы SRE // ДЗ
Тема 3. SLI, SLA, SLO и управление рисками // ДЗ
C 10 августа
Тема 4. GIT 101: совместная работа, CI, вендоринг
Тема 5. Практика управление конфигурацией. Ansible // ДЗ
Тема 6. Практика управление конфигурацией. Terraform // ДЗ
C 22 августа
Тема 7. Linux 101: cgroups/namespaces/network/containers
Тема 8. Экосистема Kubernetes
Тема 9. Практика управление конфигурацией. Helm
Тема 10. QA-сессия
C 5 сентября
Тема 11. Автоматизация: CLI, Data transformation // ДЗ
Тема 12. Aвтоматизация: Runbook Automation (Jenkins/AWX/Rundeck) // ДЗ
Тема 13. Автоматизация: Low-Code/No-Code
C 21 сентября
Тема 14. Задачи мониторинга и алертинга
Тема 15. Observability
Тема 16. Dashboard as a Code
Тема 17. QA-сессия
C 5 октября
Тема 18. Непрерывная поставка и управление изменениями // ДЗ
Тема 19. Управление релизами // ДЗ
Тема 20. Тестирование надежности систем // ДЗ
Тема 21. Управление нагрузкой предотвращения перегрузок и сбоев // ДЗ
Тема 22. Практика on-call и жизненный цикл SRE команды
Тема 23. Практика постмортемов
Тема 24. Практика диагностики и решения проблем
Тема 25. Customer Reliability Engineering
C 9 ноября
Тема 26. Как подсветить навыки в резюме. Шаблон резюме
Тема 27. Этапы собеседования: чего ждать? Live-собеседование с поведенческими вопросами
Тема 28. QA-сессия
C 21 ноября
Тема 29. Выбор темы и организация проектной работы
Тема 30. Консультация по проектам и домашним заданиям - промежуточная приемка
Тема 31. Защита проектных работ
Скачать подробную программу
Выпускной проект
Заключительный месяц курса посвящен проектной работе. Свой проект - это использование SRE практик и инструментов, которые были интересны слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе работы по проекту можно получить консультации преподавателей.

Примеры тем проекта:
- Повышение надежности своего сервиса
- Вывод сервиса в production окружение
- Покрытие мониторингом своего сервиса
- Создание процесса управления инцидентами и on-call
- Тестирование надежности своего сервиса

Пример выпуской работы: основная часть и приложение

Процесс обучения

Все обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в слаке курса, сдача домашних работ и получение обратной связи от преподавателя.

Вебинары идут дважды в неделю по 2 академических часа (то есть астрономических 1,5 часа). Все вебинары сохраняются и в записи в вашем личном кабинете.

Домашнее задание выдается в среднем одно в неделю, а его выполнение занимает 3-5 часов. Мы горячо призываем заниматься такой самостоятельной работой, так как это поможет вам качественно освоить все изучаемые технологии на практике с поддержкой и обратной связью наших преподавателей.

Возникающие вопросы по материалам лекций, домашним заданиям и по выпускному проекту вы сможете задавать преподавателю в слаке или во время вебинаров.

Курс длится 5 месяцаев, а финальный отводится для выполнения проектной работы, досдачи домашних заданий и вопросов преподавателям.

Выполнение проектной работы помогает усвоению практических навыков, а тема проекта отдельно выносится в сертификат. Во время работы над проектом студенты получают консультации и обратную связь от преподавателей в слаке группы и на проектных занятиях.
Получить консультацию
Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

После обучения вы

- Будете хорошо разбираться в SRE практиках и инструментах и сможете применять их на своих проектах
- Заберете с собой learn-материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач)
- Получите сертификат о прохождении курса
- Получите приглашение пройти собеседование в компаниях-партнерах (эту возможность получают самые успешные студенты).
Дата выдачи сертификата: 31 января 2023 года
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «SRE практики и инструменты»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «SRE практики и инструменты»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.
Прошедшие открытые вебинары
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Три слова на три буквы: SLA, SLO, SLI
Анатолий Бурнашев
День открытых дверей
25 января в 20:00
Для доступа к прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на e-mail, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Партнеры ждут выпускников этого курса

Стоимость обучения
Cтоимость указана для оплаты физическими лицами
75 000 ₽
Продолжительность
5 месяцев
Начало занятий
27 июля