Accueil    Formations    Informatique    BI et Outils décisionnels    ETL et Data Warehouse    Pentaho Data Integration - Développeur

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs pédagogiques

  • Maîtriser l'outil Pentaho Data Integration.

Niveau requis

Connaissance du SQL.

Public concerné

Tout informaticien amené à gérer des flux de données inter-application ou à alimenter un entrepôt de données.

Programme

Introduction

  • Problématique
  • EAI / ETL
  • Architecture
  • Installation

Découverte de l'environnement

  • Premier pas avec PDI
  • Vue d'ensemble des composants

Les premiers Flux

  • Les transformations
  • Les jobs
  • Generate Rows
  • Generate Random value
  • Text file Output
  • CSV Input
  • Write to log
  • Mail
  • Types de liaisons entre composants
    • Dans un Job
    • Dans une transformation
  • Exécuter un job
  • Exécuter une transformation

Traiter les données

  • Sort rows
  • Unique rows
  • Filter rows
  • String cut
  • Replace in string
  • Calculator
  • Join rows
  • Merge join
  • Merge rows
  • Group by

Les métadonnées

  • Vue d'ensemble
  • Créer une métadonnée BDD

Travailler avec les bases de données

  • Base de données supportées
  • Récupérer une table d'une métadonnée
  • Interaction avec la base de données
  • Mise en pratique
    • Jointure entre 2 tables
    • Insert / Update
    • Database

Autres composants et fonctionnalités

  • Write to log
  • Set / Get Variables
  • Copy / Get rows to result
  • Web Services Lookup
  • Propriétés d'un job et transformation

Les itérations

  • Cas général
    • Job
    • Transformation
  • Mise en pratique
    • Itération avec paramètres et "Copy rows to result"
    • Itération avec "Copy rows to result" et "Get rows from result"

Gestion des logs et des erreurs

  • Plusieurs types d'erreurs
  • Gestion d'erreurs
    • Dans un job
    • Dans une transformation
    • Paramètres de gestion d'erreurs
    • Composant "Data Validation"
  • Gestion des logs
    • Les niveaux de logs
    • Logs via la console
    • Logs sauvegardés en BDD

Fonctionnalités avancées

  • Déboguer notre application
    • Prévisualiser nos données
    • Ajout de points d'arrêts
  • Parallélisation des traitements

Automatisation et documentation

  • Exporter vos travaux
  • Kitchen : l'exécuteur de jobs
    • Fichier
    • Repository
    • Tâches planifiées
  • Documenter ses jobs

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Modalité Présentiel, Classe à distance

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous