Objectifs pédagogiques / Compétences visées
- Utiliser la bibliothèque H2O
- Gérer les modèles de Machine Learning et de Deep Learning avec H2O
- Reconnaître les cas d'utilisation avec Spark.
Niveau requis
Avoir des connaissances en Machine Learning et R.
Public concerné
Statisticiens, consultants Big Data, data analysts, data scientists.
Programme
Jour 1
Machine Learning - Fondamentaux
- Introduction au Machine Learning
- Les modèles du Machine Learning
- Deep Learning
- AutoML
Introduction à H2O
- Présentation d'H2O
- Installation
- Introduction à R
Exemple de travaux pratiques (à titre indicatif)
- Premier pas
Les arbres
- Introduction
- Les arbres de décision
- Random Forest
- Random Forest avec H2O
- Gradient Boosting Machine
- Gradient Boosting Machine avec H20
- Overfitting et Train / Validation / Test
- La validation croisée avec H20
Exemple de travaux pratiques (à titre indicatif)
- Cas d'étude d'un arbre de décision avec VC
Jour 2
Les modèles linéaires et autres
- Introduction
- Régression linéaire
- Régression logistique
- Naïve bayésien
- Hyperparamètre (Grid Search)
Exemple de travaux pratiques (à titre indicatif)
- Cas d'utilisation avec une régression
Data manipulation
- Charger et exporter la donnée avec H2O
- Les sources de données
- HDFS
- Remote Files
- Hive Import
- BDD JDBC
- Exploration de données
- Manipulation de données
- Combinaisons
- GroupBy
- Merge
- Data Pre-Processing
Deep Learning H2O
- Les réseaux de neurones
- Deep learning et le Grid Search
- Régression en Deep Learning
Jour 3
H2O : architecture et sécurité
- H2O Stack logiciel
- API REST
- Interaction avec R
- Sécuriser les modèles
- SSL Sécurité
Introduction au Sparkling Water
- Cas d'utilisation nominale
- Construction de modèles
- Le munging de données
- Les processus en stream
- Fonctionnalités
- Les sources de données supportées
- Les formats de données supportés
- Les environnements d'exécutions Spark supportés
L'API H2O
- Démarrage des services H2O
- L'allocation mémoire
- Convertir du H2OFrame au RDD
- Convertir du H2OFrame à un DataFrame
- Convertir du RDD au H2OFrame
- Convertir DataFrame au H2OFrame
- Créer un H2OFrame à partir d'une clé existante
- Le mapping des types entre H2OFrame et Spark DataFrame
- Appeler les algorithmes H2O
- Utiliser Spark Data Sources avec H2OFrame
- Lire à partir du H2OFrame
- Enregistrer dans un H2OFrame
- Charger et sauvegarder les options
- Spécifier le mode d'enregistrement à appliquer
H2O en production
- À propos des POJO et des MOJO
- MOJO Quick Start
- POJO Quick Start
- Exemple de design patterns
- Ressources supplémentaires
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)