Formation Hadoop Hortonworks - Architecture et administration – Centre de formation M2i
M2i Formation

Découvrez notre formationHadoop Hortonworks - Architecture et administration

Présentiel

5 jours (35 heures) - BIG-HORT

Accueil  ›  Formations Informatique  ›  Big Data  ›  Big Data - Infrastructure  ›  Hadoop Hortonworks - Architecture et administration

Objectifs pédagogiques

  • Maîtriser l'administration des clusters Hortonworks.

Niveau requis

Maîtriser les commandes Shell et avoir des connaissances de base autour des requêtes SQL.

Public concerné

Administrateurs système, consultants SI et architectes.

Paris La Défense27/01/20203 300 € HTDates proposées dans les agences M2iRéserver
Paris La Défense06/07/20203 300 € HTDates proposées dans les agences M2iRéserver
Paris La Défense05/10/20203 300 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Jour 1

Présentation

  • Big Data et Hadoop
  • Architecture solution
  • NoSQL

Installation Hortonworks

  • Cluster : vue d'ensemble
  • Installation de l'outil de supervision
  • Configuration de l'environnement
  • Installation de HDP

Jour 2

Gestion des utilisateurs

  • Gestion des utilisateurs et des groupes d'Ambari

Configuration des services Hadoop via Ambari

  • Configuration des services
  • Surveillance et maintenance des services

Exemple de travaux pratiques (à titre indicatif)

  • Mise en situation d'une configuration, surveillance et maintenance des services Hadoop

Jour 3

Le système HDFS (Hadoop distributed File System)

  • Utilisation du stockage HDFS
  • Utilisation de Hadoop Storage
  • Utilisation de WebHDFS
  • Utilisation des listes de contrôle d'accès HDFS
  • Gestion du stockage HDFS
  • Gestion du stockage Hadoop
  • Gestion des quotas HDFS
  • Ajout, remplacement et suppression de noeuds de travail

Exemple de travaux pratiques (à titre indicatif)

  • Manipulation des fichiers via HDFS

Gestion des Racks

  • Configuration de la prise en compte des racks (rack awareness)

Jour 4

Mise en oeuvre

  • Installation et configuration de Hue
  • HDFS ingestion de données
  • Hive et Impala
  • Pig

Exemple de travaux pratiques (à titre indicatif)

  • Analyse des données avec Hive

Apache Spark

  • Spark vue d'ensemble
  • Spark applications

Jour 5

Gestion des ressources avec YARN

  • Présentation et architecture de YARN
  • Gestion du service YARN à l'aide de l'interface utilisateur Web Ambari
  • Gestion du service YARN à l'aide de l'interface ligne de commande CLI
  • Applications YARN
  • Exécution d'exemples d'applications YARN
  • Planificateur de capacité YARN
  • Configuration de planificateur de capacité (Capacity Scheduler)
  • Gestion des conteneurs et files d'attente de YARN
  • Gestion des listes de contrôle d'accès (ACL) de YARN et des droits utilisateurs

Entretien du cluster

  • Vérification de l'état HDFS
  • Copier les données entre clusters
  • Ajout et suppression de noeuds de cluster
  • Rééquilibrage du cluster snapshots de répertoires
  • Mise à niveau du cluster

Haute disponibilité

  • Configuration de HDFS et YARN en haute disponibilité (High Availability)
  • Configuration d'un NameNode en HA
  • Configuration de ResourceManager en HA

Monitoring

  • Suivi d'un cluster
  • Gestion des alertes d'Ambari

Système de Backup

  • Protéger un cluster avec des sauvegardes
  • Gestion des photos instantanées HDFS
  • Utilisation de DistCp

Complétez votre formation