Accueil    Formations    Informatique    Big Data    Data Science    Big Data - Le développement d'applications et la Data Visualisation

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vidéo de présentation

Cette formation peut être financée grâce au CPF (Compte Personnel de Formation). Le Compte Personnel de Formation permet d'acquérir des droits à la formation professionnelle, comptabilisés en euros, que chacun peut utiliser avec ou sans l'accord de son employeur tout au long de sa vie active (y compris en période de chômage) pour suivre une formation qualifiante ou certifiante. 

Consultez le montant de vos droits CPF

Objectifs pédagogiques / Compétences visées

  • Développer des applications avec Spark
  • Utiliser la programmation parallèle sur un cluster
  • Reconnaître et exploiter les algorithmes standard de Machine Learning
  • Utiliser les bibliothèques Python pour le Machine Learning
  • Décrire le cycle d'un projet Data Science.

Niveau requis

Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Python.

Public concerné

Data analysts, Data scientists, experts en recherche opérationnelle, développeurs expérimentés avec une forte expérience en mathématiques algébriques.

Programme

Vue d'ensemble du Big Data

  • Introduction au Big Data : de quoi s'agit-il ?
  • Perspectives offertes par le Big Data
  • Les acteurs du Big Data
  • Exemples pratiques
  • Démystification du Big Data
  • Les technologies concernées
  • Les différents métiers du Big Data

Rappel

  • Le langage Python
  • Les mathématiques de base
    • Algèbre
    • Statistiques
    • Probabilités
  • Le langage SQL

Machine Learning : algorithme

  • Les concepts du Machine Learning
  • Les données supervisées ou non supervisées : quelles différences ?
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering
  • Réseaux de neurones
  • Arbres de décisions et de régression
  • Support Vector Machines (SVM)

Machine Learning avec Spark

  • Introduction à Apache Spark
  • Faire du Machine Learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes au format SQL avec Apache Spark SQL
  • Créer des graphes avec Apache Spark GraphX
  • Stockage basé sur les graphes

Outil de visualisation des données (ou Dataviz)

  • Définition de la Dataviz
  • Les acteurs de la Dataviz
  • Catégorisation des outils Dataviz
  • Comment fonctionnent les outils Dataviz ?
  • Exemples d'analyse :
    • Bibliothèques de Dataviz de Python
    • Kiaban
    • Tableau Software
    • Hue

Certification (en option)

  • Prévoir l'achat de la certification en supplément
  • L'examen (en français) sera passé le dernier jour, à l'issue de la formation et s'effectuera en ligne
  • Il s'agit d'un QCM dont la durée moyenne est d'1h30 et dont le score obtenu attestera d'un niveau de compétence

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)

Compétences attestées par la certification

  • Gérer des projets Big Data et communiquer auprès des directions et des utilisateurs
  • Maîtriser les technologies, les langages et les outils du Big Data
  • Développer de nouveaux processus d'importation pour améliorer la qualité des données
  • Appliquer le Big Data dans différents domaines d'activités.

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous