M2i Formation

Big Data - Data Analysis

Machine Learning H2O

Présentiel

3 jours (21 heures) - BIG-H2O

Accueil  ›  Formations Informatique  ›  Big Data  ›  Data Analysis  ›  Machine Learning H2O

Objectifs pédagogiques

  • Maîtriser l'utilisation du framework H2O avec Spark ou directement avec des clusters Hadoop.

Niveau requis

Avoir des connaissance en Spark, Hadoop et Scala.

Public concerné

Statisticiens, consultants Big Data, data analystes, data scientists.

La Défense24/09/20181 980 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Metz24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Mulhouse24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Nancy24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Reims24/09/20181 980 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Caen24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Évreux24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Le Havre24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Lille24/09/20181 980 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Dijon24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Grenoble24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Lyon24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Saint-Étienne24/09/20181 980 € HTDates proposées dans les agences M2iRéserver

Afficher plus de dates

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Bordeaux24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Orléans24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Tours24/09/20181 980 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Montpellier24/09/20181 980 € HTDates proposées dans les agences M2iRéserver
Sophia Antipolis24/09/20181 980 € HTDates proposées dans les agences M2iRéserver

Sessions
planifiées
Sessions
ouvertes
Sessions
confirmées
Réserver
le stage

Présentation d'H2O

Introduction au Sparkling Water

  • Cas d'utilisation nominale
  • Construction de modèles
  • Le munging de données
  • Les processus en stream
  • Fonctionnalités
  • Les sources de données supportées
  • Les formats de données supportées
  • Les environnements d'exécutions Spark supportés

Le design

  • Le partage de données entre Spark et H2O
  • Les primitives fournies par H2O

L'API H2O

  • Démarrage des services H2O
  • L'allocation mémoire
  • Convertir du H2OFrame au RDD
  • Convertir du H2OFrame à un DataFrame
  • Convertir du RDD au H2OFrame
  • Convertir DataFrame au H2OFrame
  • Créer un H2OFrame à partir d'une clé existante
  • Le mapping des types entre H2OFrame et Spark DataFrame
  • Appeler les algorithmes H2O
  • Utiliser Spark Data Sources avec H2OFrame
  • Lire à partir du H2OFrame
  • Enregistrer dans un H2OFrame
  • Charger et sauvegarder les options
  • Spécifier le mode de d'enregistrement à appliquer

Le déploiement

  • Référencer Sparkling Water
  • Utiliser Fatjar
  • Utiliser Spark Package
  • Environnements de déploiement des cibles
  • Cluster local
  • Sur un cluster Standalone
  • Sur un cluster YARN
  • Les propriétés de configuration de Sparkling Water

Compiler une application Standalone

Utiliser les sources de données Spark

  • Lire de H2OFrame
  • Sauvegarder dans H2OFrame
  • Les options de chargement et de sauvegarde