Accueil    Formations    Informatique    Big Data    Data Science    Data Science avec R

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Objectifs pédagogiques

  • Maîtriser l'utilisation de la bibliothèque H2O
  • Gérer les modèles de Machine Learning et de Deep Learning avec H2O
  • Connaître les cas d'utilisation avec Spark.

Niveau requis

Avoir des connaissances en Machine Learning et R.

Public concerné

Statisticiens, consultants Big Data, data analysts, data scientists.

Programme

Jour 1

Machine Learning - Fondamentaux

  • Introduction au Machine Learning
  • Les modèles du Machine Learning
  • Deep Learning
  • AutoML

Introduction à H2O

  • Présentation d'H2O
  • Installation
  • Introduction à R
Exemple de travaux pratiques (à titre indicatif)
  • Premier pas

Les arbres

  • Introduction
  • Les arbres de décision
  • Random Forest
  • Random Forest avec H2O
  • Gradient Boosting Machine
  • Gradient Boosting Machine avec H20
  • Overfitting et Train / Validation / Test
  • La validation croisée avec H20
Exemple de travaux pratiques (à titre indicatif)
  • Cas d'étude d'un arbre de décision avec VC

Jour 2

Les modèles linéaires et autres

  • Introduction
  • Régression linéaire
  • Régression logistique
  • Naïve bayésien
  • Hyperparamètre (Grid Search)
Exemple de travaux pratiques (à titre indicatif)
  • Cas d'utilisation avec une régression

Data manipulation

  • Charger et exporter la donnée avec H2O
    • Les sources de données
    • HDFS
    • Remote Files
    • Hive Import
    • BDD JDBC
  • Exploration de données
  • Manipulation de données
    • Combinaisons
    • GroupBy
    • Merge
    • Data Pre-Processing

Deep Learning H2O

  • Les réseaux de neurones
  • Deep learning et le Grid Search
  • Régression en Deep Learning

Jour 3

H2O : architecture et sécurité

  • H2O Stack logiciel
  • API REST
  • Interaction avec R
  • Sécuriser les modèles
  • SSL Sécurité

Introduction au Sparkling Water

  • Cas d'utilisation nominale
  • Construction de modèles
  • Le munging de données
  • Les processus en stream
  • Fonctionnalités
  • Les sources de données supportées
  • Les formats de données supportés
  • Les environnements d'exécutions Spark supportés

L'API H2O

  • Démarrage des services H2O
  • L'allocation mémoire
  • Convertir du H2OFrame au RDD
  • Convertir du H2OFrame à un DataFrame
  • Convertir du RDD au H2OFrame
  • Convertir DataFrame au H2OFrame
  • Créer un H2OFrame à partir d'une clé existante
  • Le mapping des types entre H2OFrame et Spark DataFrame
  • Appeler les algorithmes H2O
  • Utiliser Spark Data Sources avec H2OFrame
  • Lire à partir du H2OFrame
  • Enregistrer dans un H2OFrame
  • Charger et sauvegarder les options
  • Spécifier le mode d'enregistrement à appliquer

H2O en production

  • À propos des POJO et des MOJO
  • MOJO Quick Start
  • POJO Quick Start
  • Exemple de design patterns
  • Ressources supplémentaires

Partager cette formation Télécharger au format pdf Ajouter à mes favoris

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Choisissez la modalité souhaitée pour vous inscrire :

Modalité Présentiel, Classe à distance

Votre société a besoin d'une offre personnalisée ? Contactez-nous

Faites évoluer vos compétences

Complétez votre formation

Faites-nous part de votre projet de formation, nous sommes là pour vous guider.

Contactez-nous