M2i Formation

Big Data - Data Analysis

Big Data - Le développement d'applications et la Data visualisation

Présentiel

5 jours (35 heures) - BIG-DEVD

Accueil  ›  Formations Informatique  ›  Big Data  ›  Data Analysis  ›  Big Data - Le développement d'applications et la Data visualisation

Objectifs pédagogiques

  • Développer des applications avec Spark Streaming
  • Utiliser la programmation parallèle sur un cluster
  • Exploiter des données avec Spark SQL
  • Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec Graphx.

Niveau requis

Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Java ou Python.

Public concerné

Data scientists, experts en recherche opérationnelle, développeurs expérimentés avec une forte expérience en mathématiques algébriques.


Éligible aux financements suivants : Formation éligible au CPF

Fafiec

La Défense05/11/20183 300 € HTFormation garantie, plus que quelques places de disponiblesRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Fafiec

Metz05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Mulhouse05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Nancy05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Reims05/11/20183 300 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Fafiec

Caen05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Évreux05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Le Havre05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Lille05/11/20183 300 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Fafiec

Dijon05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Grenoble05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Lyon05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Saint-Étienne05/11/20183 300 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Fafiec

Bordeaux05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Orléans05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Tours05/11/20183 300 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Fafiec

Aix-en-Provence05/11/20183 300 € HTInscriptions en cours, places disponiblesRéserver
Montpellier05/11/20183 300 € HTDates proposées dans les agences M2iRéserver
Sophia Antipolis05/11/20183 300 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Certification : M2i Expertises Big Data (+ 120€)

Big Data overview

  • Introduction au Big Data : de quoi s'agit-il ?
  • Exemples pratiques
  • Les technologies concernées
  • Les outils
  • Les langages :
    • Hortonworks
    • MapR
    • Cloudera
    • IBM Watson...
  • Démystification du Big Data
  • Les acteurs principaux
  • Les différents métiers du Big Data

Rappel

  • Le langage Python (application de la MapReduce)
  • Les mathématiques de base (algèbre, statistiques, probabilités)
  • Le langage SQL

Les algorithmes et analyse de données

  • Les concepts du Machine Learning
  • Les données supervisées ou non supervisées ? Quelles différences ?
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering
  • Réseaux de neurones
  • Arbres de décisions et de régression
  • Support vector machines
  • Méthodes ensemblistes

Machine Learning avec : Spark et Spark Streaming

  • Introduction à Apache Spark
  • Faire du Machine learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes en format SQL avec Apache Spark SQL
  • Créer des graphes avec Apache Spark GraphX
  • Stockage basé sur les graphes

Visualisation

  • La valeur de la visualisation
  • Modèles de données et images
  • Données multidimensionnelles
  • Principes de design
  • Perception graphique

Restitution et pilotage

  • Couleurs
  • Itérations sur la perception
  • Techniques d'interactions
  • Exemples d'analyses : efficacité des antibiotiques
  • Visualisation Big Data

Certification (en option)

  • Nos tests de validation des compétences font partie intégrante du processus d'apprentissage car ils permettent de développer différents niveaux d'abstractions.
  • Solliciter l'apprenant à l'aide de nos QCM, c'est lui permettre d'étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d'ancrage mémoriel.
  • L'examen sera passé à la fin de la formation.