Objectifs pédagogiques / Compétences visées
- Reconnaître l'histoire du SRE (Site Reliability Engineering) et son émergence au sein de Google
- Expliquer l'inter-relation du SRE avec DevOps et d'autres dispositifs populaires
- Définir les principes sous-jacents du SRE
- Identifier les SLO (Service Level Objectives) et leur orientation utilisateur
- Gérer les SLI (Service Level Indicators) et le contexte moderne de surveillance
- Mettre en place des budgets d'erreurs et les politiques budgétaires d'erreurs associées
- Expliquer le "Toil" et ses effets sur la productivité d'une organisation
- Décrire quelques mesures pratiques qui peuvent aider à éliminer le "Toil"
- Mettre en oeuvre l'observabilité comme indicateur de l'état de santé d'un service
- Utiliser les outils SRE, techniques d'automatisation et l'importance de la sécurité
- Décrire l'antifragilité, l'approche de l'échec et les tests de défaillance
- Mesurer l'impact organisationnel qu'apporte l'introduction du SRE.
Niveau requis
Avoir une compréhension et une connaissance de la terminologie et des concepts communs de DevOps. Il est également recommandé d'avoir une expérience professionnelle dans ce domaine.
Public concerné
Toute personne qui entame ou mène une démarche vers une fiabilité accrue. Ou toute personne intéressée par les approches modernes en matière de leadership et de changement organisationnel dans le domaine de l'IT.
Partenaire / Éditeur
Programme
Principes et pratiques SRE
- Qu'est-ce que le SRE ?
- SRE et DevOps : quelle est la différence ?
- Principes et pratiques SRE
SLO (Service Level Objectives) et budgets d'erreurs
- SLO
- Budgets d'erreurs
- Politiques budgétaires d'erreurs
Réduire le "Toil"
- Qu'est-ce que le "Toil" ?
- En quoi est-ce que le "Toil" est-il mauvais ?
- Remédier au "Toil"
Surveillance et SLI (Service Level Indicators)
- SLI
- Surveillance
- Observabilité
Outils et automatisation SRE
- Définition de l'automatisation
- Focus sur l'automatisation
- Hiérarchie des types d'automatisation
- Automatisation sécurisée
- Outils d'automatisation
Antifragilité et apprentissage à partir d'un échec
- Pourquoi apprendre à partir d'un échec
- Avantages de l'antifragilité
- Modification de l'équilibre organisationnel
Impact organisationnel du SRE
- Pourquoi les organisations adoptent le SRE
- Modèles pour l'adoption du SRE
- Nécessités de garde
- Post-mortems irréprochables
- SRE et échelle
SRE, autres cadres et l'avenir
- SRE et autres cadres
- L'avenir
Sources d'informations supplémentaires
Préparation et passage de la certification
- Le prix et le passage de l'examen sont inclus dans la formation
- L'examen (en anglais) a lieu le dernier jour, à l'issue de la formation et s'effectue en ligne, pour une durée moyenne d'1h00
- Il s'agit d'un QCM de 40 questions (65% de bonnes réponses sont nécessaires pour l'obtention de la certification)
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)
Les + de la formation
Le support de cours est en anglais.
DevOps Institute recommande fortement ce qui suit pour préparer les candidats à l'examen de certification "DevOps Site Reliability Engineering Fnd" :
- avoir suivi au moins 16 heures d'enseignement
- consacrer au moins six heures à l'étude personnelle, à la révision de la liste de vocabulaire et des sections pertinentes du manuel du participant et à la passation de l'examen blanc.