fff

Combien de stagiaires suivront cette formation ?


Valider Annuler

Accueil    Formations    Informatique    Cloud    Cloud public    Amazon Web Services - Data Warehousing

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs pédagogiques

  • Présenter les concepts de base de l'entreposage de données
  • Concevoir et optimiser le stockage et le traitement des données dans un Data Warehouse
  • Décrire les architectures de données OLAP, les processus et les phases de traitement de la donnée avant le stockage dans un Data Warehouse
  • Identifier les problèmes de performance, optimiser les requêtes et optimiser la base de données pour de meilleures performances
  • Utiliser Amazon Redshift Spectrum pour analyser des données directement à partir d'un compartiment Amazon S3.

Modalités et moyens pédagogiques

Formation délivrée en présentiel ou distanciel* (e-learning, classe virtuelle, présentiel à distance).

Le formateur alterne entre méthode** démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation).

Variables suivant les formations, les moyens pédagogiques mis en oeuvre sont :

  • Ordinateurs Mac ou PC (sauf pour les cours de l'offre Management), connexion internet fibre, tableau blanc ou paperboard, vidéoprojecteur ou écran tactile interactif (pour le distanciel)
  • Environnements de formation installés sur les postes de travail ou en ligne
  • Supports de cours et exercices

En cas de formation intra sur site externe à M2i, le client s'assure et s'engage également à avoir toutes les ressources matérielles pédagogiques nécessaires (équipements informatique...) au bon déroulement de l'action de formation visée conformément aux prérequis indiqués dans le programme de formation communiqué.

* nous consulter pour la faisabilité en distanciel

** ratio variable selon le cours suivi

Niveau requis

Avoir suivi la formation AWS-FND "Amazon Web Services - Notions techniques de base" ou avoir les connaissances équivalentes. Il faut également être familier avec les bases de données relationnelles et les notions de conception de bases de données.

Public concerné

Architectes, administrateurs et développeurs de bases de données, analystes et ingénieurs de données.

Programme

Jour 1

Introduction au Data Warehouse

  • Base de données relationnelle
  • Concepts du Data Warehouse
  • Data Warehouse et Big Data
  • Présentation du Data Management dans AWS

Introduction à AWS Redshift

  • Concepts théoriques
  • Solution orientée économie de coût
  • Solution hautement performante
  • Solution sécurisée
Exemples de travaux pratiques (à titre indicatif)
  • Etude de cas : "Data Warehouse au fil de l'eau"
  • Lab : "Introduction à Redshift"

Démarrer un cluster

  • Les exigences techniques et métier d'un cluster
  • Configuration réseau d'un cluster
  • Chiffrement
  • Connexion à un cluster
  • Monitoring et audit
  • Analyse de la donnée

Jour 2

Conception du schéma de base de données

  • Schémas et types des données
  • Compression Columnar
  • Type de Data Distribution
Exemple de travaux pratiques (à titre indicatif)
  • Lab : "Optimiser le schéma de base de données"

Chargement de la donnée

  • Préparation de la donnée
  • Chargement de la donnée via COPY
  • Maintenance des tables
  • Opérations d'écritures concurrentielles
  • Dépannage des problématiques de chargement
Exemple de travaux pratiques (à titre indicatif)
  • Lab : "Chargement de données avec la commande COPY"

Jour 3

Ecriture des requêtes et optimisation des performances

  • Amazon Redshift SQL
  • User Defined Functions (UDF)
  • Facteurs affectant les performances des requêtes
  • Présentation de Command et des Query Plan
  • Workload Management (WLM)
Exemple de travaux pratiques (à titre indicatif)
  • Lab : "Configurer Workload Management"

Redshift Spectrum

  • Le côté obscur de la donnée
  • Amazon Redshift Spectrum
  • Configuration d'Amazon Redshift Spectrum
  • Les requêtes via Amazon Redshift Spectrum
Exemple de travaux pratiques (à titre indicatif)
  • Lab : "Utiliser Amazon Redshift Spectrum"

Maintenance des clusters

  • Audit Logging
  • Performance monitoring
  • Evénements et notifications
  • Audit et monitoring des clusters
  • Redimensionnement des clusters
  • Sauvegarde et restauration des clusters
  • Balisage des ressources
  • Ressources et contraintes
  • Haute disponibilité et reprise après sinistre
Exemple de travaux pratiques (à titre indicatif)
  • Lab : "Sauvegarde, restauration et redimensionnement d'un cluster"

Analyse et visualisation de la donnée

  • Les bénéfices de la visualisation
  • Construction des tableaux de bord
  • Amazon Quicksight
  • Démonstration d'Amazon Quicksight

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • Tout au long de la formation, au travers d'ateliers et de mises en pratique

Les + de la formation

Le support de cours et les labs sont en anglais.

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Formation disponible en intra-entreprise

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous