SRE практики и инструменты

Что даст вам этот курс
26
1
Ожидаемая дата старта - июнь 2019.
Для напоминания о старте набора на курс можете оставить свой адрес в опросной форме ниже.
За обратную связь по программе в этой же форме мы будем очень благодарны!

Это первый курс по SRE в России. Мы рассмотрим все доступные SRE практики и инструменты, будем следовать SRE принципам, поймем как выстраивать SRE процессы и обсудим связь с DevOps. Полученные знания можно сразу применять к своей ежедневной работе и улучшать жизнь себе, коллегам, проекту и компании. В курсе мы подробно разберем современные SRE практики на примерах таких компаний как Google, Facebook, Netflix, Spotify, Evernote, PagerDuty, NewRelic. А также рассмотрим SRE подходы в российских компаниях - Яндекс, Mail.ru, Авито, Badoo, HH.ru. Курс подготовлен на основе опыта, накопленного компанией Экспресс 42, которая на протяжении уже более 5 лет, помогает внедрять DevOps и SRE практики в крупных российских и зарубежных компаниях.

На курсе мы рассказываем про надежность, доступность и эффективность сервисов, про управление изменениями, мониторинг, реагирование на инциденты и производительность своих сервисов. Практические задания будем выполнять на базе следующего технологического стека: Linux, AWS, GCP, Ansible, Salt, Consul, Prometheus, Okmeter, NewRelic, PagerDuty, Perf, Strace, Go, Python.

Кому будет полезен этот курс
- Разработчикам, которые развиваются дальше. Те, кто заинтересован в получении опыта эксплуатации сервисов. Те, кто думают о надежности своих сервисов или отвечают за свои сервисы в production окружениях;
- Инфраструктурным и платформенным инженерам, которые начали предоставлять свои платформы как сервис;
- Техническим директорам, руководителям и тимлидам, которые хотят разобраться и внедрить SRE практики и инструменты.

Минимальные требования:
- Опыт из разработки, тестирования или эксплуатации;
- Будет плюсом один из пройденных курсов по разработке в ОТУС;
- Будет плюсом пройденный курс по Linux;
- Будет плюсом пройденный курс по DevOps практикам и инструментам;

Заключительный месяц курса посвящен проектной работе. Свой проект это использование SRE практик и инструментов, которые были интересны слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе работы по проекту можно получить консультации преподавателей.

Примеры тем проекта:
- Повышение надежности своего сервиса;
- Вывод сервиса в production окружение;
- Покрытие мониторингом своего сервиса;
- Создание процесса управления инцидентами и on-call;
- Тестирование надежности своего сервиса;

Длительность курса - 4 месяца
Программа обучения
Модуль 1
Введение в SRE
Модуль 2
Принципы SRE
Модуль 3
Практики SRE
Модуль 4
Управление в SRE
Введение в SRE
Программа курса составлена на основе опыта, накопленного компанией Экспресс 42, которая на протяжении уже более 5 лет, помогает внедрять DevOps и SRE практики в крупных российских и зарубежных компаниях.
Оценить модуль
3
1
Введение в SRE
Поговорим об истории SRE, связью с DevOps и рассмотрим варианты взаимодействия. Обсудим подход SRE к управлению сервисами и различные варианты Reliability Engineering: Site, Production, Database.
Оценить занятие
0
1
Правила SRE и среда эксплуатации
Разберем основные правила работы и обсудим среду эксплуатации с точки зрения SRE.

SRE, Network, Hardware, Cloud, VM, Docker, K8s
Оценить занятие
0
0
Принципы SRE
Оценить модуль
3
0
SLI, SLA, SLO и управление рисками
Управление рисками - одна из самых важных практик. Обсудим, как SRE оценивает риски, управляет ими и использует лимит времени недоступности сервиса для того, чтобы объективно принимать решения. SLI, SLA, SLO - фундаментальные понятия для SRE. Рассмотрим каждый из этих понятий и определим показатели для сервиса.

SLI, SLA, SLO, error budget
Оценить занятие
0
0
Автоматизация
Рассмотрим подход SRE к автоматизации, а также примеры ее реализации — как успешные, так и неудачные.

IaC, Ad-hoc
Оценить занятие
0
0
Мониторинг
Мониторинг - один из основных компонентов успешной работы ПО. Если вы не можете наблюдать за сервисом, вы не знаете, что с ним происходит, а если вы не знаете, что происходит, то не можете гарантировать надежность. Получим представление о том, как и за какими компонентами следует наблюдать.

USE, RED, 4 Golden signals
Оценить занятие
0
0
Непрерывная поставка
Обсудим как обеспечить уверенность в стабильности и качестве выпускаемого продукта с помощью непрерывной поставки.
Оценить занятие
1
0
Снижение рутины и стремление к простоте
Рассмотрим, как избавиться от утомительной работы. Мы считаем утомительной и рутинной работу однообразную, повторяющуюся изо дня в день, но не дающую конкретных значимых результатов; объем такой работы растет пропорционально росту сервиса. И обсудим основной принцип эффективной разработки ПО - стремление к простоте.
Оценить занятие
1
0
Практики SRE
Оценить модуль
3
0
Практика оповещений
Разберем практику оповещений, изучим процессы и варианты оповещений, выберем инструментарий.
Оценить занятие
1
0
Практика on-call
Погрузимся в жизнь дежурного инженера. Поговорим про организацию и культуру дежурств. Разберем реализации на практике.
Оценить занятие
0
0
Практика диагностики и решения проблем
Рассмотрим примеры анализа реальных ситуаций и изучим инструментарий.
Оценить занятие
1
0
Практика реагирования на инциденты
Поймем что делать, когда система сломалась. Разберем разные типы аварий, вызванные тестированием, изменениями конфигурации и процессом. Обсудим выводы.
Оценить занятие
1
0
Практика управления инцидентами
Познакомимся с типами инцидентов и разберем их анатомию. Обсудим процессы управления в критических ситуациях.
Оценить занятие
1
0
Практика постмортемов
Поговорим про философию постмортемов, рассмотрим хороший и плохой постмортем. Поймем с чего начать внедрение культуры постмортема. Разберем примеры, инструменты и шаблоны.
Оценить занятие
1
0
Практика управление конфигурацией
Поговорим про управление конфигурацией с точки зрения SRE. Рассмотрим различные подходы.
Оценить занятие
1
0
Практика управление релизами
Рассмотрим практику управления релизами и координацию процесса. Разработаем чек-лист для запуска, обсудим приемы надежных релизов и роль SRE инженера.
Оценить занятие
1
0
Практика управления нагрузкой
Обсудим балансировку нагрузки на уровне фронтенда и датацентра, рассмотрим политики балансировки нагрузки.
Оценить занятие
1
0
Практика предотвращения перегрузок и сбоев
Узнаем как справиться с перегрузками, обсудим причины сбоев и способы их избежать.
Оценить занятие
1
0
Практика тестирования надежности систем
Рассмотрим виды тестирования ПО, процессы и инструменты. Поговорим про Chaos Engineering и проведение учений.

Chaos engineering
Оценить занятие
1
0
Практика разрешения конфликтов
Обсудим алгоритмы разрешения конфликтов и координацию распределенных систем.

Paxos
Оценить занятие
0
0
Практика конвейера обработки данных
Начнем разбираться в построении конвейеров для обработки данных.
Оценить занятие
0
0
Практика сохранности данных
Поговорим про стратегии для обеспечения сохранности данных, узнаем про целевые значения показателей сохранности и доступности и как SRE справляется справляется с трудностями обеспечения сохранности данных, обсудим общие принципы, применяемые для сохранности данных.
Оценить занятие
1
0
Практика разработки в SRE
Ответим на вопрос почему так важна разработка ПО внутри SRE и поговорим про культивирование разработки ПО в SRE.
Оценить занятие
1
0
Практика машинного обучения
Поговорим про машинное обучение и чем оно может быть полезно SRE на практике.
Оценить занятие
1
0
Управление в SRE
Оценить модуль
3
0
Управление прерываниями и операционной нагрузкой
Узнаем как управлять операционной нагрузкой и прерываниями. Разберем на примерах.
Оценить занятие
0
0
Жизненный цикл SRE команды
Рассмотрим жизненный цикл SRE команды: создание, найм, обучение, общение и взаимодействие внутри SRE команды.
Оценить занятие
0
0
Взаимодействие с SRE
Обсудим варианты взаимодействия с SRE командой. Масштабирование SRE и реализация SRE в enterprise проектах.
Оценить занятие
0
0
Опрос по программе «SRE практики и инструменты»

При запуске нового курса, нам очень важно оценивать качество и актуальность предлагаемой программы на этапе идеи и концепции модулей, поэтому мы будем очень рады и благодарны вашим ответам, экспертным оценкам и комментариям.

Вопрос №1 из 7
Ваше имя и фамилия
Вопрос №2 из 7
Выберите один вариант ответа
Вам понятно, о чем этот курс?
оцените от 1 (не понял) до 5 (да, все ясно)
Вопрос №3 из 7
Выберите один вариант ответа
Является ли этот курс интересным лично для вас?
оцените от 1 (совсем не интересно) до 5 (круто, интересно, я бы пошел)
Вопрос №4 из 7
Выберите один вариант ответа
Как вы думаете, будет ли этот курс востребован на рынке?
оцените от 1 (совсем не интересно) до 5 (да, думаю, людям понравится)
Вопрос №5 из 7
Выберите один вариант ответа
Как вы оцениваете актуальность такой программы?
оцените от 1 (категорически устарела) до 5 (современная или даже на хайпе)
Вопрос №6 из 7
Выберите один вариант ответа
Можно ли реализовать в рамках курса предложенные идеи проекта?
оцените от 1 (не сработает, идея нерабочая) до 5 (да, проект получится отличный и полезный)
Вопрос №7 из 7
Комментарии и предложения - мы всегда им рады!