M2i Formation

Découvrez notre formationData Science avec R (H2O)

Présentiel

3 jours (21 heures) - BIG-H2O

Accueil  ›  Formations Informatique  ›  Big Data  ›  Data Science  ›  Data Science avec R (H2O)

Objectifs pédagogiques

  • Maîtriser l'utilisation de la bibliothèque H2O
  • Gérer les modèles de Machine Learning et de Deep Learning avec H2O
  • Connaître les cas d'utilisation avec Spark.

Niveau requis

Avoir des connaissances en Machine Learning et R.

Public concerné

Statisticiens, consultants Big Data, data analysts, data scientists.

Paris La Défense17/02/20201 980 € HTDates proposées dans les agences M2iRéserver
Paris La Défense11/05/20201 980 € HTDates proposées dans les agences M2iRéserver
Paris La Défense24/08/20201 980 € HTDates proposées dans les agences M2iRéserver
Paris La Défense16/11/20201 980 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Jour 1

Machine Learning - Fondamentaux

  • Introduction au Machine Learning
  • Les modèles du Machine Learning
  • Deep Learning
  • AutoML

Introduction à H2O

  • Présentation d'H2O
  • Installation
  • Introduction à R

Exemple de travaux pratiques (à titre indicatif)

  • Premier pas

Les arbres

  • Introduction
  • Les arbres de décision
  • Random Forest
  • Random Forest avec H2O
  • Gradient Boosting Machine
  • Gradient Boosting Machine avec H20
  • Overfitting et Train / Validation / Test
  • La validation croisée avec H20

Exemple de travaux pratiques (à titre indicatif)

  • Cas d'étude d'un arbre de décision avec VC

Jour 2

Les modèles linéaires et autres

  • Introduction
  • Régression linéaire
  • Régression logistique
  • Naïve bayésien
  • Hyperparamètre (Grid Search)

Exemple de travaux pratiques (à titre indicatif)

  • Cas d'utilisation avec une régression

Data manipulation

  • Charger et exporter la donnée avec H2O
    • Les sources de données
    • HDFS
    • Remote Files
    • Hive Import
    • BDD JDBC
  • Exploration de données
  • Manipulation de données
    • Combinaisons
    • GroupBy
    • Merge
    • Data Pre-Processing

Deep Learning H2O

  • Les réseaux de neurones
  • Deep learning et le Grid Search
  • Régression en Deep Learning

Jour 3

H2O : architecture et sécurité

  • H2O Stack logiciel
  • API REST
  • Interaction avec R
  • Sécuriser les modèles
  • SSL Sécurité

Introduction au Sparkling Water

  • Cas d'utilisation nominale
  • Construction de modèles
  • Le munging de données
  • Les processus en stream
  • Fonctionnalités
  • Les sources de données supportées
  • Les formats de données supportés
  • Les environnements d'exécutions Spark supportés

L'API H2O

  • Démarrage des services H2O
  • L'allocation mémoire
  • Convertir du H2OFrame au RDD
  • Convertir du H2OFrame à un DataFrame
  • Convertir du RDD au H2OFrame
  • Convertir DataFrame au H2OFrame
  • Créer un H2OFrame à partir d'une clé existante
  • Le mapping des types entre H2OFrame et Spark DataFrame
  • Appeler les algorithmes H2O
  • Utiliser Spark Data Sources avec H2OFrame
  • Lire à partir du H2OFrame
  • Enregistrer dans un H2OFrame
  • Charger et sauvegarder les options
  • Spécifier le mode d'enregistrement à appliquer

H2O en production

  • À propos des POJO et des MOJO
  • MOJO Quick Start
  • POJO Quick Start
  • Exemple de design patterns
  • Ressources supplémentaires

Faites évoluer vos compétences

Complétez votre formation

En cliquant le bouton « Accepter », vous acceptez l’utilisation de cookies pour réaliser des mesures d’audiences et vous permettre d’enregistrer vos préférences de navigation. En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies.

Accepter Paramètres En savoir plus