Objectifs pédagogiques
- Décrire l'histoire du SRE (Site Reliability Engineering) et son émergence chez Google
- Expliquer l'inter-relation du SRE avec DevOps et d'autres cadres populaires
- Définir les principes sous-jacents du SRE
- Identifier les SLO (Service Level Objectives) et leur orientation vers l'utilisateur
- Gérer les SLI (Service Level Indicators) et le contexte moderne de surveillance
- Mettre en place des budgets d'erreurs et les politiques budgétaires d'erreurs associées
- Expliquer le "Toil" et ses effets sur la productivité d'une organisation
- Décrire quelques mesures pratiques qui peuvent aider à éliminer le "Toil"
- Mettre en oeuvre l'observabilité comme indicateur de l'état de santé d'un service
- Décrire les outils SRE, techniques d'automatisation et l'importance de la sécurité
- Expliquer l'antifragilité, l'approche de l'erreur et les tests d'erreur
- Mesurer l'impact organisationnel de la mise en place du SRE.
Niveau requis
Avoir une compréhension et une connaissance de la terminologie et des concepts DevOps. Il est également recommandé d'avoir une expérience professionnelle dans ce domaine.
Public concerné
Business Managers, Business Stakeholders, agents du changement, consultants, praticiens DevOps, directeurs informatiques, responsables informatiques, chefs d'équipe informatique, Product Owners, Scrum Masters, ingénieurs logiciel, ingénieurs de la fiabilité des sites, intégrateurs de systèmes, éditeurs d'outils, toute personne qui entame ou mène une démarche vers une fiabilité accrue, ou toute personne intéressée par les approches modernes en matière de leadership et de changement organisationnel dans le domaine de l'IT.
Partenaire / Éditeur
Programme
SRE : principes et pratiques
- Qu'est-ce que le SRE ?
- SRE et DevOps : quelle est la différence ?
- Principes et pratiques du SRE
SLO (Service Level Objectives) et budgets d'erreurs
- SLO
- Budgets d'erreurs
- Politiques budgétaires d'erreurs
Réduire le "Toil"
- Qu'est-ce que le "Toil" ?
- En quoi est-ce que le "Toil" est-il mauvais ?
- Remédier au "Toil"
Surveillance et SLI (Service Level Indicators)
- SLI
- Surveillance
- Observabilité
SRE : outils et automatisation
- Définition de l'automatisation
- Focus sur l'automatisation
- Hiérarchie des types d'automatisation
- Automatisation sécurisée
- Outils d'automatisation
Antifragilité et apprendre des erreurs
- Pourquoi apprendre par l'erreur
- Avantages de l'antifragilité
- Modification de l'équilibre organisationnel
Impact organisationnel du SRE
- Pourquoi les organisations adoptent le SRE
- Modèles pour l'adoption du SRE
- Nécessités de "à la demande"
- Post-mortems sans reproche
- SRE et mise à l'échelle
SRE, autres cadres et tendances
- SRE et autres cadres
- Tendance
Sources d'informations supplémentaires
Préparation à l'examen
- Exigences d'examen, répartition des questions et liste des concepts et de la terminologie
- Exemple d'examen
Passage de la certification
- Le prix et le passage de l'examen sont inclus dans la formation
- L'examen (en français) a lieu le dernier jour, à l'issue de la formation et s'effectue en ligne, pour une durée moyenne d'1h00
- Il s'agit d'un QCM de 40 questions (65% de bonnes réponses sont nécessaires pour l'obtention de la certification)
Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)
Les + de la formation
Le support de cours est en français.
DevOps Institute recommande fortement ce qui suit pour préparer les candidats à l'examen de certification "DevOps Site Reliability Engineering Fnd" :
- avoir suivi au moins 16 heures d'enseignement
- consacrer au moins six heures à l'étude personnelle, à la révision de la liste de vocabulaire et des sections pertinentes du manuel du participant et à la passation de l'examen blanc.