Objectifs pédagogiques / Compétences visées
- Gérer l'administration des clusters Hortonworks
- Configurer et monitorer le cluster avec Ambari
- Identifier les technologies des HDP (Hortonworks Data Platforms).
Niveau requis
Avoir des connaissances de base autour des requêtes SQL et sur les commandes Shell.
Public concerné
Administrateurs système et consultants SI.
Programme
Jour 1
Introduction
- Introduction au Big Data
- Présentation de Hadoop et de son écosystème
- Architecture solution
- NoSQL
- Présentation
- Hortonworks Data Platform (HDP)
- Ambari
Installation d'un cluster HDP
- Cluster : vue d'ensemble
- Justification d'une solution de gestion de cluster
- Caractéristiques du Cloudera Manager
- Prérequis pour l'installation d'un cluster
- SSH (Secure Shell)
- Installation de HDP
- Installation de l'agent Ambari
- Management des noeuds sous Ambari
Exemples de travaux pratiques (à titre indicatif)
- Installation du HDP
- Préparation des environnements
Jour 2
Administration de Hadoop sous HDP
- Vue d'ensemble
- Les racks
- Rééquilibrage des données dans HDFS (Hadoop Distributed File System)
- Configuration de HDP
- Gestion des alertes dans HDP
- Gérer les instances de rôle
- Ajouter de nouveaux services
- Ajouter et supprimer des hôtes
Exemple de travaux pratiques (à titre indicatif)
- Configuration et gestion des alertes dans HDP
Le système de stockage
- Fonctionnalités HDFS
- Ecriture et lecture de fichiers
- Considérations relatives à la mémoire NameNode
- Vue d'ensemble de la sécurité HDFS
- Gestion du stockage HDFS
- Utilisation de Hadoop File Shell
- Hbase
Exemple de travaux pratiques (à titre indicatif)
- Manipulation des fichiers via HDFS
Jour 3
Ingestion des données HDFS
- Ingestion de données
- Importer la donnée relationnelle avec SQOOP
- Ingérer la donnée avec NiFi
- Bonnes pratiques pour l'importation de données
Accès et analyse des données
- Apache
- Hive
- Impala
- Spark
- Exécution de frameworks de calcul sur YARN
Sécurité Hadoop
- Importance de la sécurité Hadoop
- Concepts du système de sécurité de Hadoop
- Présentation et fonctionnement de Kerberos
- Sécurisation d'un cluster Hadoop avec Kerberos
- Autres concepts de sécurité
Surveillance et dépannage du cluster
- Fonctionnalités de surveillance du Cloudera Manager
- Tests de santé
- Surveillance des clusters Hadoop
- Dépannage des clusters Hadoop
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)