Скачать курс «SRE: data-driven подход к управлению надёжностью систем» — Селиванов П., Федорков В., Лакосников П., Гусев М., Бухаров С. | Отзывы | Складчина

SRE: data-driven подход к управлению надёжностью систем

0/5 ·
Создан: 5 мая 2021 г. Обновлён: 2 мая 2026 г.

Курс «Проектирование надежности сайта — Site Reliability Engineering» от Slurm представляет собой интенсивную программу, направленную на освоение data-driven подхода к управлению надежностью сложных систем. SRE (Site Reliability Engineering) — это методология, которая решает задачи, схожие с DevOps, но с фокусом на обеспечение стабильности сервисов. Основная цель курса — научить инженеров и разработчиков минимизировать время простоя, сокращать количество ошибок и делать бизнес, опирающийся на информационные системы, более устойчивым и предсказуемым. Программа ориентирована на тех, кто хочет перестать работать в режиме «пожарной команды» и перейти к системному управлению надежностью.

Обучение построено на глубокой практике. Участники работают с учебным проектом — сайтом по продаже билетов в кинотеатры, состоящим из набора микросервисов. В ходе интенсива студенты проходят полный цикл жизни SRE-инженера: от проектирования архитектуры и настройки мониторинга до ликвидации аварий и проведения постмортемов. Вы научитесь формулировать показатели SLO, SLI и SLA, разрабатывать инфраструктуру, способную их поддерживать, и настраивать алертинг, который действительно помогает, а не создает «шум». Особое внимание уделяется управлению инцидентами: участники тренируются работать под давлением, выстраивать приоритеты и эффективно взаимодействовать с командой и стейкхолдерами в условиях ограниченного времени.

Курс дает возможность не только изучить теорию, но и применить её на практике: вы будете «ломать» систему, имитируя ошибки разработчиков, отказы инфраструктуры и DoS-атаки, а затем «чинить» её, анализируя причины сбоев и внедряя изменения в архитектуру и процессы. Вы узнаете, как правильно проводить онбординг проектов в SRE-команды, как настраивать Health Checking в Kubernetes и как внедрять канареечные релизы. Программа сформирована экспертами из ведущих мировых и российских компаний, таких как Google, Booking, Databricks, Яндекс и других, что гарантирует актуальность знаний и их применимость в реальных условиях.

Для успешного прохождения обучения участникам потребуются навыки работы с Linux, Kubernetes и базовое знание Python для решения кейсов. Если навыков программирования недостаточно, предусмотрена работа в командах, где экспертиза распределяется между участниками. Формат обучения включает теоретические модули, практические кейсы, разборы с экспертами и регулярные AMA-сессии, где можно получить ответы на любые вопросы. По итогам курса вы получите четкое понимание того, как снизить ущерб от отказов, как правильно собирать метрики, как быстро восстанавливать продакшн и как выстроить процессы, которые сделают ваш сервис надежным и масштабируемым.

0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

К
80 ₽ 350 ₽ −77%

Книга Управление производством: планирование и диспетчеризация

Б
Предзаказ
17 495 ₽ 74 500 ₽ −77%

Безопасность и тестирование на проникновение мобильных приложений (MASPT v2)

eLearnSecurity
Программа Грамотность. Начальный уровень: 1-2 классы
380 ₽ 45 000 ₽ −99%

Программа Грамотность. Начальный уровень: 1-2 классы

Елена Артёмова
Fashion-скетчинг и технический рисунок Предзаказ
6 080 ₽ 36 000 ₽ −83%

Fashion-скетчинг и технический рисунок

Fashion Factory
Python Start: Основы программирования Предзаказ
2 145 ₽ 3 200 ₽ −33%

Python Start: Основы программирования

Python Start
Бисквитные рецептурные карты. Фисташка-малина Предзаказ
1 000 ₽

Бисквитные рецептурные карты. Фисташка-малина

kasadelika