Accueil    Formations    Informatique    Big Data    Data Science    Big Data - Le développement d'applications et la Data Visualisation

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Comment utiliser vos droits
sur Mon Compte Formation

Objectifs pédagogiques

  • Développer des applications avec Spark
  • Utiliser la programmation parallèle sur un cluster
  • Comprendre et exploiter les algorithmes standard de Machine Learning
  • Maîtriser les bibliothèques Python pour le Machine Learning
  • Découvrir le cycle d'un projet Data Science.

Niveau requis

Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Python.

Public concerné

Data analysts, Data scientists, experts en recherche opérationnelle, développeurs expérimentés avec une forte expérience en mathématiques algébriques.

Programme

Vue d'ensemble du Big Data

  • Introduction au Big Data : de quoi s'agit-il ?
  • Perspectives offertes par le Big Data
  • Les acteurs du Big Data
  • Exemples pratiques
  • Démystification du Big Data
  • Les technologies concernées
  • Les différents métiers du Big Data

Rappel

  • Le langage Python
  • Les mathématiques de base
    • Algèbre
    • Statistiques
    • Probabilités
  • Le langage SQL

Machine Learning : algorithme

  • Les concepts du Machine Learning
  • Les données supervisées ou non supervisées : quelles différences ?
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering
  • Réseaux de neurones
  • Arbres de décisions et de régression
  • Support Vector Machines (SVM)

Machine Learning avec Spark

  • Introduction à Apache Spark
  • Faire du Machine Learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes au format SQL avec Apache Spark SQL
  • Créer des graphes avec Apache Spark GraphX
  • Stockage basé sur les graphes

Outil de visualisation des données (ou Dataviz)

  • Définition de la Dataviz
  • Les acteurs de la Dataviz
  • Catégorisation des outils Dataviz
  • Comment fonctionnent les outils Dataviz ?
  • Exemples d'analyse :
    • Bibliothèques de Dataviz de Python
    • Kiaban
    • Tableau Software
    • Hue

Certification (en option)

  • Prévoir l'achat de la certification en supplément
  • L'examen (en français) sera passé le dernier jour, à l'issue de la formation et s'effectuera en ligne
  • Il s'agit d'un QCM dont la durée moyenne est d'1h30 et dont le score obtenu attestera d'un niveau de compétence

Modalités d’évaluation des acquis

L'évaluation des acquis se fait :

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)

Compétences visées

  • Gérer des projets Big Data et communiquer auprès des directions et des utilisateurs
  • Maîtriser les technologies, les langages et les outils du Big Data
  • Développer de nouveaux processus d'importation pour améliorer la qualité des données
  • Appliquer le Big Data dans différents domaines d'activités.

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous