M2i Formation

Découvrez notre formationBig Data - Les techniques d'analyse et de visualisation

Présentiel

5 jours (35 heures) - BIG-TECH

Accueil  ›  Formations Informatique  ›  Big Data  ›  Data Analysis  ›  Big Data - Les techniques d'analyse et de visualisation

Objectifs pédagogiques

  • Charger et exploiter des données de toute source pour la restituer après un ensemble de traitement, de nettoyage et d'enrichissement des données.

Niveau requis

Avoir des compétences Java 8 Streaming, Python et Scala et des connaissances sur Talend et/ou en BI est un plus.

Public concerné

Développeurs, chefs de projets, responsables qualité.


Cette formation est éligible au CPF : code unique 235758

Formation éligible au financement suivant :
ACFafiec

La Défense29/07/20193 750 € HTInscriptions en cours, places disponiblesRéserver
La Défense30/09/20193 750 € HTInscriptions en cours, places disponiblesRéserver
La Défense25/11/20193 750 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Certification : M2i Expertises Big Data (+ 120€)

Big Data overview

  • Introduction au Big Data : de quoi s'agit-il ?
  • Exemples pratiques
  • Les technologies concernées
  • Les outils
  • Les langages : 
    • Hortonworks
    • MapR
    • Cloudera
    • IBM Watson…
  • Démystification du Big Data
  • Les acteurs principaux
  • Les différents métiers du Big Data

Architecture Big Data

  • La capture des données
    • MapReduce, PIG, Hive…
  • La mise en qualité
  • Le stockage des données
  • La diffusion des données
  • Traitements en temps réel ou différé
    • Kafka
  • Les architectures réparties
    • Hadoop

L'ingestion et le stockage des données

  • Importance de la qualité des données
  • Coût de la mauvaise qualité
  • Cas d'usage
  • Qu'est-ce que la qualité de données ?
  • Traitements de la qualité dans le MDM
  • Mesure de la qualité d’un entrepôt de données : fiabilisation ou restauration de la qualité
  • Aspects méthodologiques de la qualité (workflow) : Data curation / gouvernance
  • Aspects juridiques liés à la qualité : best practices pour la qualité

L'analyse des données : Spark et Spark Streaming

  • Introduction à Apache Spark
  • Apache Spark MLlib
  • Apache Spark Streaming
  • Apache Spark SQL
  • Apache Spark GraphX
  • Stockage basé sur les graphes

Visualisation des données

  • Couleurs
  • Itérations sur la perception
  • Techniques d'interactions
  • Exemples d'analyses : efficacité des antibiotiques
  • Visualisation Big Data
  • R, Graph

Certification (en option)

  • Nos tests de validation des compétences font partie intégrante du processus d'apprentissage car ils permettent de développer différents niveaux d'abstractions.
  • Solliciter l'apprenant à l'aide de nos QCM, c'est lui permettre d'étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d'ancrage mémoriel.
  • L'examen sera passé à la fin de la formation.

Les + de la formation

L'examen de certification est en français.

En cliquant le bouton « Accepter », vous acceptez l’utilisation de cookies pour réaliser des mesures d’audiences et vous permettre d’enregistrer vos préférences de navigation. En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies.

Accepter Paramètres En savoir plus