Accueil    Formations    Informatique    Big Data    Data Engineering    Big Data - Le développement d'applications et la Data Visualisation

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs pédagogiques

  • Développer des applications avec Spark Streaming
  • Utiliser la programmation parallèle sur un cluster
  • Exploiter des données avec Spark SQL
  • Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec GraphX.

Niveau requis

Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Java ou Python.

Public concerné

Data scientists, experts en recherche opérationnelle, développeurs expérimentés avec une forte expérience en mathématiques algébriques.

Programme

Vue d'ensemble du Big Data

  • Introduction au Big Data : de quoi s'agit-il ?
  • Exemples pratiques
  • Les technologies concernées
  • Les outils
  • Les langages
    • Hortonworks
    • MapR
    • Cloudera
    • IBM Watson...
  • Démystification du Big Data
  • Les acteurs principaux
  • Les différents métiers du Big Data

Rappel

  • Le langage Python (application de la MapReduce)
  • Les mathématiques de base (algèbre, statistiques, probabilités)
  • Le langage SQL

Les algorithmes et analyse de données

  • Les concepts du Machine Learning
  • Les données supervisées ou non supervisées ? Quelles différences ?
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering
  • Réseaux de neurones
  • Arbres de décisions et de régression
  • Support vector machines
  • Méthodes ensemblistes

Machine Learning avec : Spark et Spark Streaming

  • Introduction à Apache Spark
  • Faire du Machine Learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes en format SQL avec Apache Spark SQL
  • Créer des graphes avec Apache Spark GraphX
  • Stockage basé sur les graphes

Visualisation

  • La valeur de la visualisation
  • Modèles de données et images
  • Données multidimensionnelles
  • Principes de design
  • Perception graphique

Restitution et pilotage

  • Couleurs
  • Itérations sur la perception
  • Techniques d'interactions
  • Exemples d'analyses : efficacité des antibiotiques
  • Visualisation Big Data

Certification (en option)

  • Nos tests de validation des compétences font partie intégrante du processus d'apprentissage car ils permettent de développer différents niveaux d'abstractions.
  • Solliciter l'apprenant à l'aide de nos QCM, c'est lui permettre d'étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d'ancrage mémoriel.
  • L'examen sera passé à la fin de la formation.

Les + de la formation

L'examen de certification (proposé en option) est en français.

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Modalité Présentiel, Classe à distance

Certification M2i Expertises Big Data (+ 120€)

Financements CPF & Actions-CO

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous