Objectifs pédagogiques
- Expliquer et mettre en place un processus complet de Machine Learning
- Explorer et préparer les données
- Choisir et appliquer le bon algorithme
- Entraîner et améliorer votre modèle et le déployer.
Modalités et moyens pédagogiques
Formation délivrée en présentiel ou distanciel* (e-learning, classe virtuelle, présentiel à distance).
Le formateur alterne entre méthode** démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation).
Variables suivant les formations, les moyens pédagogiques mis en oeuvre sont :
- Ordinateurs Mac ou PC (sauf pour les cours de l'offre Management), connexion internet fibre, tableau blanc ou paperboard, vidéoprojecteur ou écran tactile interactif (pour le distanciel)
- Environnements de formation installés sur les postes de travail ou en ligne
- Supports de cours et exercices
En cas de formation intra sur site externe à M2i, le client s'assure et s'engage également à avoir toutes les ressources matérielles pédagogiques nécessaires (équipements informatique...) au bon déroulement de l'action de formation visée conformément aux prérequis indiqués dans le programme de formation communiqué.
* nous consulter pour la faisabilité en distanciel
** ratio variable selon le cours suivi
Niveau requis
Connaître les bases du Cloud Microsoft Azure et les bases du langage Python.
Public concerné
Développeurs, datascientists.
Programme
Introduction au Machine Learning
- Définition
- Vocabulaire
- A quelles questions répond le Machine Learning ?
- Atelier : Introduction au Machine Learning
Exploration des données
- Explorer les données pour un algorithme dit de régression
- Explorer les données pour un algorithme dit de classement
- Azure Machine Learning Workbench et Azure Notebook
- Atelier : Visualiser les données pour une régression et pour une classification
Préparer les données
- Gérer les données dupliquées
- Gérer les données manquantes
- Gérer les erreurs
- Transformer et splitter les données
- Etudier les "features"
- Azure Machine Learning Workbench et Azure Notebook
- Atelier : Préparer les données en Pyhton et avec Azure Machine Learning Workbench
Algorithme supervisée
- Les bases de Scikit-Learn
- Régression linéaire et classification
- Logistic regression
- Loss Function et ROC
- Atelier : Créer un modèle de régression et de classification
Amélioration du modèle
- Selection des "features"
- Régularisation
- Interpréter les "features"
- Paramètres
- Validation croisée
- Atelier : Selection, réduction, cross-validation, Biais-Variance Trade-Off
Entraîner et déployer le modèle dans Azure
- Entraîner localement un modèle
- Entraîner le modèle dans le Cloud
- Déployer son modèle
- Atelier : Entraîner et déployer le modèle
Les autres algorithmes
- Arbres de décisions
- Méthodes des ensembles
- Réseaux de neurones
- Support Vector Machines (SVM)
- Théorème de Bayes
- Atelier : Bagging, Boosting, RNN, SVM, Naïve Bayes
Algorithme non-supervisé
- Clustering
- Atelier : Application d'un cluster
Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation