SRE практики и инструменты: решение проблемы надежности и доступности сервисов

Курсы

Программирование
Выбор профессии в IT
-99%
Python Developer. Basic Специализация Python Developer Python Developer. Professional Golang Developer. Professional Базы данных iOS Developer. Basic Computer Science Android Developer. Professional Team Lead Android Developer. Basic Специализация Android-разработчик Vue.js разработчик Groovy Developer JavaScript Developer. Basic Специализация Java-разработчик C++ Developer. Basic Специализация Fullstack developer Unity Game Developer. Basic PHP Developer. Professional Agile Project Manager PostgreSQL для администраторов баз данных и разработчиков MS SQL Server Developer Unreal Engine Game Developer. Professional Web-разработчик на Python Cloud Solution Architecture Flutter Mobile Developer PHP Developer. Basic Специализация PHP Developer Rust Developer Буткемп Java Unity VR/AR Developer
Специализации Курсы в разработке Подготовительные курсы Подписка
+7 499 938-92-02
Курс переработан
Курс переработан

SRE практики и инструменты

Научим как ориентироваться в SRE и разъяснить их принципы коллегам. И расскажем как выстраивать SRE-процессы

Длительность обучения:

5 месяцев

4 ак. часа в нед.

Начало занятий:

14 марта 2023 года

Что даст вам этот курс

Site Reliability Engineering - это подход к организации IT Operations. 
Команды SRE используют программное обеспечение как инструмент для управления системами, решения проблем и автоматизации операционных задач.

SRE берет на себя задачи, которые исторически выполнялись операторами и системными администраторами, часто вручную, и вместо этого передает их операционным группам, которые используют программное обеспечение и автоматизацию для решения проблем и управления системами.

SRE - это практики создания масштабируемых и высоконадежных программных систем. SRE помогает управлять большими системами с помощью подхода "инфраструктура как код (IaC)", который является масштабируемым, самодокументируемым и воспроизводимым, позволяющим управлять тысячами компьютеров силами нескольких специалистов.

Курс подойдет для:

- Разработчиков, которые хотят получить дополнительные компетенции для работы в production окружениях
- Системных инженеров, в задачи которых входит обеспечение надежности и доступности
- Инфраструктурных и платформенных инженеров, которые начали предоставлять свои сервисы другим командам
- Техническим директорам, руководителям и тимлидам, которые хотят разобраться и внедрить SRE практики и инструменты

На курсе вы узнаете, как:

- Что такое SRE и SRE-практики
- Как внедрить SRE практики в своей организации
- Как управлять надежностью, доступностью и эффективностью сервисов
- Управлять изменениями
- Осуществлять мониторинг и улучшать наблюдаемость системы
- Реагировать на инциденты и проблемы с производительностью

Практические задания будем выполнять на базе следующего технологического стека: 
- Linux, Yandex Cloud, Kubernetes, Ansible, Terraform, Prometheus, Python.


По окончании курса вы будете:

- Ориентироваться в SRE-практиках и инструментах
- Уметь разъяснить SRE-принципы коллегам
- Понимать как выстраивать SRE-процессы в контексте взаимодействия с другими отделами компании
- Сможете применять полученные знания в своей ежедневной работе, улучшая жизнь себе, коллегам, проекту и компании

Преподаватели

Сергей Караткевич
Анастасия Порхун
Анатолий Бурнашев
Эксперт Центра практик обеспечения надёжности в MTS.Digital
Дмитрий Жиляев
Валерий Безруков
Помогаю людям понять что именно делают компьютеры
Работал в финтехе, телекоме, разработке игр, последние годы в бизнес и технологическом консалтинге.
Мои сильные стороны - планирование, разработка, деплоймент и отладка гетерогенных окружений, взаимодействие с бизнесом и клиентами.

Стек: Linux, Ansible, Terraform, инфраструктура уровня датацентра

В индустрии с 2012 года.

Имеет опыт работы в телеком- и аутсорс- компаниях, с государственными структурами. Занимается проектированием и разработкой ПО, выстраиванием процессов CI/CD, а также исследованиями в сфере информационной безопасности.

Считаю, что программировать стоит с использованием языка, стек технологий необходимо продумывать под задачу, а безопасность должна обеспечиваться на всех этапах жизненного цикла ПО.

20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

average devops enjoyer

Работал в Selectel и Rabota.ru

Поймал волну helm и создал helmwave

Google Cloud Practice Delivery Manager в EPAM Systems
В прошлом SRE & DevOps team lead в Intelligent Blockchain Labs.

Разрабатывал и поддерживал гибридные облачные и высоконагруженные системы (Google Cloud Platform, OpenStack, Hashicorp Terraform)

Занимался развертыванием, эксплуатацией и поддержкой CI/CD (GitLab CI, Hashicorp Nomad, Kubernetes).

Опыт со следующим стеком технологий : Kubernetes/Docker
, Unix/Solaris/Linux, OpenStack, Oracle/PostgreSQL/Hadoop, Google Cloud Platform

Сергей
Караткевич
Анастасия
Порхун
Анатолий
Бурнашев
Дмитрий
Жиляев
Валерий
Безруков

Преподаватели

Сергей Караткевич
Помогаю людям понять что именно делают компьютеры
Работал в финтехе, телекоме, разработке игр, последние годы в бизнес и технологическом консалтинге.
Мои сильные стороны - планирование, разработка, деплоймент и отладка гетерогенных окружений, взаимодействие с бизнесом и клиентами.

Стек: Linux, Ansible, Terraform, инфраструктура уровня датацентра

Анастасия Порхун
В индустрии с 2012 года.

Имеет опыт работы в телеком- и аутсорс- компаниях, с государственными структурами. Занимается проектированием и разработкой ПО, выстраиванием процессов CI/CD, а также исследованиями в сфере информационной безопасности.

Считаю, что программировать стоит с использованием языка, стек технологий необходимо продумывать под задачу, а безопасность должна обеспечиваться на всех этапах жизненного цикла ПО.

Анатолий Бурнашев
Эксперт Центра практик обеспечения надёжности в MTS.Digital
20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Дмитрий Жиляев
average devops enjoyer

Работал в Selectel и Rabota.ru

Поймал волну helm и создал helmwave

Валерий Безруков
Google Cloud Practice Delivery Manager в EPAM Systems
В прошлом SRE & DevOps team lead в Intelligent Blockchain Labs.

Разрабатывал и поддерживал гибридные облачные и высоконагруженные системы (Google Cloud Platform, OpenStack, Hashicorp Terraform)

Занимался развертыванием, эксплуатацией и поддержкой CI/CD (GitLab CI, Hashicorp Nomad, Kubernetes).

Опыт со следующим стеком технологий : Kubernetes/Docker
, Unix/Solaris/Linux, OpenStack, Oracle/PostgreSQL/Hadoop, Google Cloud Platform

Необходимые знания


- Опыт из разработки, тестирования или эксплуатации
- Будет плюсом один из пройденных курсов по разработке в ОТУС
- Будет плюсом пройденные курсы по DevOps практикам и инструментам и Linux
Корпоративное обучение для ваших сотрудников
>
Программа обучения
В процессе обучения вы получите комплексные знания и навыки.
Тема 1. Введение в SRE // ДЗ
Тема 2. GIT 101: совместная работа, CI, вендоринг
Тема 3. Основные принципы SRE // ДЗ
Тема 4. Практика управление конфигурацией. Ansible // ДЗ
Тема 5. Практика управление конфигурацией. Terraform // ДЗ
Тема 6. Linux 101: cgroups/namespaces/network/containers
Тема 7. Экосистема Kubernetes
Тема 8. Практика управление конфигурацией. Helm
Тема 9. QA-сессия
Тема 10. SLI, SLA, SLO и управление рисками // ДЗ
Тема 11. Автоматизация: Low-Code/No-Code
Тема 12. Автоматизация: CLI, Data transformation // ДЗ
Тема 13. Aвтоматизация: Runbook Automation (Jenkins/AWX/Rundeck) // ДЗ
Тема 14. Задачи мониторинга и алертинга
Тема 15. Observability
Тема 16. QA-сессия
Тема 17. Непрерывная поставка и управление изменениями // ДЗ
Тема 18. Управление релизами // ДЗ
Тема 19. Тестирование надежности систем // ДЗ
Тема 20. Управление нагрузкой предотвращения перегрузок и сбоев // ДЗ
Тема 21. Практика on-call и жизненный цикл SRE команды
Тема 22. Практика постмортемов
Тема 23. Практика диагностики и решения проблем
Тема 24. Customer Reliability Engineering
Тема 25. Как подсветить навыки в резюме. Шаблон резюме
Тема 26. Этапы собеседования: чего ждать? Live-собеседование с поведенческими вопросами
Тема 27. QA-сессия
Тема 28. Dashboard as a Code
Тема 29. Выбор темы и организация проектной работы
Тема 30. Консультация по проектам и домашним заданиям - промежуточная приемка
Тема 31. Защита проектных работ
Скачать подробную программу
Выпускной проект
Заключительный месяц курса посвящен проектной работе. Свой проект - это использование SRE практик и инструментов, которые были интересны слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе работы по проекту можно получить консультации преподавателей.

Примеры тем проекта:
- Повышение надежности своего сервиса
- Вывод сервиса в production окружение
- Покрытие мониторингом своего сервиса
- Создание процесса управления инцидентами и on-call
- Тестирование надежности своего сервиса

Процесс обучения

Все обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в слаке курса, сдача домашних работ и получение обратной связи от преподавателя. Вебинары идут дважды в неделю по 2 академических часа (то есть астрономических 1,5 часа). Все вебинары сохраняются и в записи в вашем личном кабинете. Домашнее задание выдается в среднем одно в неделю, а его выполнение занимает 3-5 часов. Мы горячо призываем заниматься такой самостоятельной работой, так как это поможет вам качественно освоить все изучаемые технологии на практике с поддержкой и обратной связью наших преподавателей. Возникающие вопросы по материалам лекций, домашним заданиям и по выпускному проекту вы сможете задавать преподавателю в слаке или во время вебинаров. Курс длится 5 месяцаев, а финальный отводится для выполнения проектной работы, досдачи домашних заданий и вопросов преподавателям. Выполнение проектной работы помогает усвоению практических навыков, а тема проекта отдельно выносится в сертификат. Во время работы над проектом студенты получают консультации и обратную связь от преподавателей в слаке группы и на проектных занятиях.
Получить консультацию
Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

После обучения вы

- Будете хорошо разбираться в SRE практиках и инструментах и сможете применять их на своих проектах
- Заберете с собой learn-материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач)
- Получите сертификат о прохождении курса
- Получите приглашение пройти собеседование в компаниях-партнерах (эту возможность получают самые успешные студенты).
Дата выдачи сертификата: 18 сентября 2023 года
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «SRE практики и инструменты»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «SRE практики и инструменты»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.
Прошедшие открытые вебинары
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
GIT 101: совместная работа, CI, вендоринг
Сергей Караткевич
День открытых дверей
25 января в 20:00
Оставьте заявку, чтобы получить доступ к записям прошедших мероприятий. Записи всех мероприятий появятся в этом блоке

Партнеры ждут выпускников этого курса