Accueil    Formations    Informatique    Big Data    Big Data - Administration et infrastructure    Hortonworks - Administration d'une plateforme

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs pédagogiques / Compétences visées

  • Gérer l'administration des clusters Hortonworks
  • Configurer et monitorer le cluster avec Ambari
  • Identifier les technologies des HDP (Hortonworks Data Platforms).

Niveau requis

Avoir des connaissances de base autour des requêtes SQL et sur les commandes Shell.

Public concerné

Administrateurs système et consultants SI.

Programme

Jour 1

Introduction

  • Introduction au Big Data
  • Présentation de Hadoop et de son écosystème
  • Architecture solution
  • NoSQL
  • Présentation
    • Hortonworks Data Platform (HDP)
    • Ambari

Installation d'un cluster HDP

  • Cluster : vue d'ensemble
  • Justification d'une solution de gestion de cluster
    • Caractéristiques du Cloudera Manager
    • Prérequis pour l'installation d'un cluster
    • SSH (Secure Shell)
    • Installation de HDP
    • Installation de l'agent Ambari
    • Management des noeuds sous Ambari
Exemples de travaux pratiques (à titre indicatif)
  • Installation du HDP
  • Préparation des environnements

Jour 2

Administration de Hadoop sous HDP

  • Vue d'ensemble
  • Les racks
  • Rééquilibrage des données dans HDFS (Hadoop Distributed File System)
  • Configuration de HDP
  • Gestion des alertes dans HDP
  • Gérer les instances de rôle
  • Ajouter de nouveaux services
  • Ajouter et supprimer des hôtes
Exemple de travaux pratiques (à titre indicatif)
  • Configuration et gestion des alertes dans HDP

Le système de stockage

  • Fonctionnalités HDFS
  • Ecriture et lecture de fichiers
  • Considérations relatives à la mémoire NameNode
  • Vue d'ensemble de la sécurité HDFS
  • Gestion du stockage HDFS
  • Utilisation de Hadoop File Shell
  • Hbase
Exemple de travaux pratiques (à titre indicatif)
  • Manipulation des fichiers via HDFS

Jour 3

Ingestion des données HDFS

  • Ingestion de données
    • Importer la donnée relationnelle avec SQOOP
    • Ingérer la donnée avec NiFi
  • Bonnes pratiques pour l'importation de données

Accès et analyse des données

  • Apache
    • Hive
    • Impala
    • Spark
    • Exécution de frameworks de calcul sur YARN

Sécurité Hadoop

  • Importance de la sécurité Hadoop
  • Concepts du système de sécurité de Hadoop
  • Présentation et fonctionnement de Kerberos
  • Sécurisation d'un cluster Hadoop avec Kerberos
  • Autres concepts de sécurité

Surveillance et dépannage du cluster

  • Fonctionnalités de surveillance du Cloudera Manager
  • Tests de santé
  • Surveillance des clusters Hadoop
  • Dépannage des clusters Hadoop

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous