Accueil    Formations    Informatique    Big Data    Data Engineering    Data analyst - Analyse de données en environnement Hadoop

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs pédagogiques

  • Savoir comment Hadoop Distributed File System (HDFS) et YARN / MapReduce fonctionnent
  • Explorer HDFS
  • Suivre l'exécution d'une application YARN
  • Utiliser les différents outils de manipulation de la donnée tels que : Hue, Hive, Pig, Tez, Sqoop et Oozie.

Niveau requis

Avoir une expérience dans la manipulation de données.

Public concerné

Tout utilisateur devant manipuler les données dans un Cluster Apache Hadoop.

Programme

Introduction

  • Présentation générale d'Hadoop
  • Exemples d'utilisation dans différents secteurs
  • Historique et chiffres clés
    • Quand parle-t-on de Big Data ?

L'écosystème d'Hadoop

  • Le système de fichier HDFS
  • Le paradigme MapReduce et l'utilisation à travers YARN

Manipulation des données dans un Cluster Hadoop

  • Hue : comment fonctionne cette interface Web ?
  • Hive : pourquoi ce n'est pas une base de données ?
    • Requête sur Hive
    • Utilisation de HCatalog
    • Utilisation avancée sur Hive
    • Utilisation de fonctions utilisateurs
    • Paramétrage de requête
  • Pig : fonctionnement
    • Programmation avec Pig Latin
    • Utilisation du mode Local
    • Utilisation de fonctions utilisateurs
  • Tez : qu'est-ce que c'est ?
    • Comment et quand l'utiliser ?
  • Oozie : fonctionnement
    • Création de workflows avec Oozie
    • Manipulation des workflows
    • Ajout d'éléments d'exploitation dans les workflows
    • Ajout de conditions d'exécution
    • Paramétrage des workflows
  • Sqoop : à quoi ça sert ?
    • Chargement des données depuis une base de données relationnelle
    • Chargement des données depuis Hadoop
    • Utilisation et paramétrage avancée

Les particularités des distributions

  • Impala et HAWQ

Quelles sont les bonnes pratiques d'utilisation des différents outils ?

    Partager cette formation Télécharger au format pdf Ajouter à mes favoris

    Calendrier des sessions

    08/06/2020 Levallois-Perret 2 151 € HT Je m'inscris

    16/09/2020 Levallois-Perret 2 151 € HT Je m'inscris

    02/11/2020 Levallois-Perret 2 151 € HT Je m'inscris

    Modalité Présentiel

    Tarif indicatif : 2 151 € HT

    Pour connaître les prochaines dates disponibles, en présentiel ou à distance, contactez-nous.

    Contactez-nous


    Modalité Présentiel

    Tarif indicatif : 2 151 € HT

    Pour connaître les prochaines dates disponibles, en présentiel ou à distance, contactez-nous.

    Contactez-nous


    Modalité Présentiel

    Tarif indicatif : 2 151 € HT

    Pour connaître les prochaines dates disponibles, en présentiel ou à distance, contactez-nous.

    Contactez-nous


    Modalité Présentiel

    Tarif indicatif : 2 151 € HT

    Pour connaître les prochaines dates disponibles, en présentiel ou à distance, contactez-nous.

    Contactez-nous


    Modalité Présentiel

    08/06/2020 Sophia Antipolis 2 151 € HT Je m'inscris

    16/09/2020 Sophia Antipolis 2 151 € HT Je m'inscris

    02/11/2020 Sophia Antipolis 2 151 € HT Je m'inscris

    Modalité Présentiel

    Votre société a besoin d'une offre personnalisée ? Contactez-nous

    Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

    Contactez-nous