M2i Formation

Découvrez notre formationBig Data - Le développement d'applications et la Data Visualisation

Présentiel

5 jours (35 heures) - BIG-DEVD

Accueil  ›  Formations Informatique  ›  Big Data  ›  Data Engineering  ›  Big Data - Le développement d'applications et la Data Visualisation

Objectifs pédagogiques

  • Développer des applications avec Spark Streaming
  • Utiliser la programmation parallèle sur un cluster
  • Exploiter des données avec Spark SQL
  • Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec GraphX.

Niveau requis

Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Java ou Python.

Public concerné

Data scientists, experts en recherche opérationnelle, développeurs expérimentés avec une forte expérience en mathématiques algébriques.


Cette formation est éligible au CPF : code unique 235758

Formation éligible au financement suivant :
ACFafiec

Paris La Défense16/12/20193 300 € HTFormation garantie, plus que quelques places de disponiblesRéserver
Paris La Défense10/02/20203 300 € HTDates proposées dans les agences M2iRéserver
Paris La Défense25/05/20203 300 € HTDates proposées dans les agences M2iRéserver
Paris La Défense06/07/20203 300 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Certification : M2i Expertises Big Data (+ 120€)

Vue d'ensemble du Big Data

  • Introduction au Big Data : de quoi s'agit-il ?
  • Exemples pratiques
  • Les technologies concernées
  • Les outils
  • Les langages
    • Hortonworks
    • MapR
    • Cloudera
    • IBM Watson...
  • Démystification du Big Data
  • Les acteurs principaux
  • Les différents métiers du Big Data

Rappel

  • Le langage Python (application de la MapReduce)
  • Les mathématiques de base (algèbre, statistiques, probabilités)
  • Le langage SQL

Les algorithmes et analyse de données

  • Les concepts du Machine Learning
  • Les données supervisées ou non supervisées ? Quelles différences ?
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering
  • Réseaux de neurones
  • Arbres de décisions et de régression
  • Support vector machines
  • Méthodes ensemblistes

Machine Learning avec : Spark et Spark Streaming

  • Introduction à Apache Spark
  • Faire du Machine Learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes en format SQL avec Apache Spark SQL
  • Créer des graphes avec Apache Spark GraphX
  • Stockage basé sur les graphes

Visualisation

  • La valeur de la visualisation
  • Modèles de données et images
  • Données multidimensionnelles
  • Principes de design
  • Perception graphique

Restitution et pilotage

  • Couleurs
  • Itérations sur la perception
  • Techniques d'interactions
  • Exemples d'analyses : efficacité des antibiotiques
  • Visualisation Big Data

Certification (en option)

  • Nos tests de validation des compétences font partie intégrante du processus d'apprentissage car ils permettent de développer différents niveaux d'abstractions.
  • Solliciter l'apprenant à l'aide de nos QCM, c'est lui permettre d'étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d'ancrage mémoriel.
  • L'examen sera passé à la fin de la formation.

Les + de la formation

L'examen de certification (proposé en option) est en français.

Complétez votre formation

En cliquant le bouton « Accepter », vous acceptez l’utilisation de cookies pour réaliser des mesures d’audiences et vous permettre d’enregistrer vos préférences de navigation. En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies.

Accepter Paramètres En savoir plus