Data Science avec Spark ML - Formation Data Science

fff

Accueil › Formations › Informatique › Big Data › Data Science › Data Science avec Spark ML

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs de formation

A l'issue de cette formation, vous serez capable de :

Créer des applications et des pipelines de ML (Machine Learning) et d'IA (Intelligence Artificielle) sur Spark avec Python.

Modalités, méthodes et moyens pédagogiques

Formation délivrée en présentiel ou distanciel* (blended-learning, e-learning, classe virtuelle, présentiel à distance).

Le formateur alterne entre méthode** démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation).

Variables suivant les formations, les moyens pédagogiques mis en oeuvre sont :

Ordinateurs Mac ou PC (sauf pour certains cours de l'offre Management), connexion internet fibre, tableau blanc ou paperboard, vidéoprojecteur ou écran tactile interactif (pour le distanciel)
Environnements de formation installés sur les postes de travail ou en ligne
Supports de cours et exercices

En cas de formation intra sur site externe à M2i, le client s'assure et s'engage également à avoir toutes les ressources matérielles pédagogiques nécessaires (équipements informatiques...) au bon déroulement de l'action de formation visée conformément aux prérequis indiqués dans le programme de formation communiqué.

* nous consulter pour la faisabilité en distanciel

** ratio variable selon le cours suivi

Prérequis

Avoir suivi le cours BIG-PYT "Data Science avec Python (Scikitlearn)" ou avoir les connaissances équivalentes en Data Science et Python.

Public concerné

Statisticiens, consultants Big Data, Data analysts, Data scientists.

Programme

Jour 1

Introduction au Big Data et à Apache Spark

Introduction au Big Data
Les challenges du Big Data
Notion de pipeline de Machine Learning
Présentation de Spark
Atouts de Spark
Ecosystème Spark
Spark sur Databricks vs Spark sur Hadoop
Spark Web UI
Utilisation de Spark Shell
Création d'un contexte Spark
Les exécuteurs Spark
Chargement d'un fichier en Shell
Réalisation d'opérations basiques sur un fichier avec Spark Shell

Exemple de travaux pratiques (à titre indicatif)

Mise en oeuvre de scripts Spark pour l'analyse de données et de Machine Learning

Jour 2

Spark Machine Learning

Rappels sur le Machine Learning
Machine Learning dans Spark
Spark ML API
DataFrames
Transformateurs et estimateurs
Construction, évaluation, et affichage de pipelines dans Spark
Travailler avec un pipeline
Sélection de modèles via une validation croisée
Les types supportés, les algorithmes et les utilitaires
Les types de données
Les fonctionnalités d'extraction et les statistiques basiques

Exemples de travaux pratiques (à titre indicatif)

Création de modèles et de pipelines de Machine Learning avec Spark
Démonstration de serving d'un modèle avec Neptune et/ou Databricks

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

En cours de formation, par des études de cas ou des travaux pratiques
Et, en fin de formation, par un questionnaire d'auto-évaluation

Accessibilité de la formation

Le groupe M2i s'engage pour faciliter l'accessibilité de ses formations. Les détails de l'accueil des personnes en situation de handicap sont consultables sur la page Accueil et Handicap.

Modalités et délais d’accès à la formation

Les formations M2i sont disponibles selon les modalités proposées sur la page programme. Les inscriptions sont possibles jusqu'à 48 heures ouvrées avant le début de la formation. Dans le cas d'une formation financée par le CPF, ce délai est porté à 11 jours ouvrés.

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Tarif : à partir de 1 520 € HT.

Choisissez la modalité souhaitée pour vous inscrire :

Suivre cette formation en présentiel
Suivre cette formation en classe à distance

Modalité Présentiel, Classe à distance

Formation disponible en intra-entreprise

Perfectionnement / Avancé

Présentiel Classe à distance

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous

Offres spécifiques

Offres éditeurs et partenaires

Combien de stagiaires suivront cette formation ?

Objectifs de formation

Modalités, méthodes et moyens pédagogiques

Prérequis

Public concerné

Programme

Jour 1

Introduction au Big Data et à Apache Spark

Exemple de travaux pratiques (à titre indicatif)

Jour 2

Spark Machine Learning

Exemples de travaux pratiques (à titre indicatif)

Modalités d’évaluation des acquis

Accessibilité de la formation

Modalités et délais d’accès à la formation

Vous souhaitez suivre cette formation ?

Formation disponible en intra-entreprise

Calendrier des sessions

Formation disponible en intra-entreprise

Découvrez les autres formations susceptibles de vous intéresser :

Big Data - Développement d'applications de Machine Learning et d'Intelligence Artificielle (IA) Top ventes

À propos

Nos formations

Les sites du groupe M2i

Services M2i

International

Comment souhaitez-vous partager ?

Big Data - Développement d'applications de Machine Learning et d'Intelligence Artificielle (IA) ^{Top ventes}