Состояние DevOps и SRE в 2018 году

Наш эксперт, Игорь Курочкин, рассказал про текущее состояние DevOps и Site Reliability Engineering на митапе DevOps Moscow 2018. Игорь собрал огромный и уникальный материал, изучив конференции, книги и публикации экспертов, а также основываясь на своем опыте работы SRE инженером в компаниях Skype и Microsoft.

В докладе рассмотрены:
  1. Хронология развития SRE и DevOps, включая ключевые события и практики, сформировавшие оба подхода в период с 2003 по 2018 год, а также влияние крупных технологических компаний на их распространение;
  2. Определение SRE от автора подхода Ben Traynor — "SRE is what happens when you ask a software engineer to design an operations team";
  3. DevOps как движение и профессиональное сообщество, направленное на устранение проблем взаимодействия между разработкой и эксплуатацией, а не как набор отдельных инструментов или ролей;
  4. Истоки DevOps через смежные подходы и практики: Agile, Lean, Agile Infrastructure, опыт компаний 10+ Deploys Per Day, принципы и практика Continuous Delivery, сообщество DevOpsDays, как основа для последующего масштабирования инженерных практик;
  5. Технологический радар от компании Thoughtworks, включая анализ того, как и на каком этапе зрелости DevOps и SRE появлялись и закреплялись на радаре;
  6. DevOps топологии, а также паттерны и анти-паттерны команд: DevOps Team Silo, Rebranded SysAdmin, DevOps Team with an Expiry Date, Dev and Ops Collaboration, Fully Shared Ops Responsibilities и SRE Team (Google Model), с пояснением их ограничений и применимости;
  7. Конференция SREcon от USENIX и доклады, посвященные надежности и эксплуатации, от компаний Google, Microsoft, Facebook, Linkedin, Ebay, Booking, Netflix, Spotify и Uber как источники практического опыта и реальных кейсов;
  8. Опыт Facebook в развитии SRE под названием Production Engineering, а также доклад руководителя Production Engineering Pedro Canahuati — Notes from Production Engineering, как пример альтернативной терминологии при сохранении сути подхода;
  9. Книги по SRE и DevOps: Site Reliability Engineering, The Site Reliability Workbook, Seeking SRE, Database Reliability Engineering, The DevOps Handbook, с акцентом на их роль в формировании общего корпуса знаний и практик;
  10. Связь между практиками DevOps и SRE, рекомендации по их развитию в организациях, а также оценка состояния DevOps и SRE в России на 2018 год с учетом локального контекста и уровня зрелости команд.

Подробнее в презентации и на схемах ниже:
Если вам интересно развитие практик SRE в вашей компании или команде, обращайтесь к нам за помощью. Мы помогаем развивать процессы и практики надежности, проводим аудиты команд и анализ процессов эксплуатации и поставки, готовим рекомендации по развитию, проводим тренинги и воркшопы.

Не забывайте подписываться на наш канал Enabling.team Insights, чтобы оставаться в курсе технологических трендов.