Formation Programmation R et intégration Big Data – Centre de formation M2i
M2i Formation

Découvrez notre formationProgrammation R et intégration Big Data

Présentiel

3 jours (21 heures) - BIG-ENVR

Accueil  ›  Formations Informatique  ›  Big Data  ›  Data Science  ›  Programmation R et intégration Big Data

Objectifs pédagogiques

  • Maîtriser les principales fonctions statistiques de R
  • Utiliser des programmes R dans un environnement Big Data, en s'appuyant sur le système distribué HDFS.

Niveau requis

Avoir des notions de calculs statistiques.

Public concerné

Chefs de projets, data scientists, statisticiens, développeurs souhaitant comprendre les apports de R pour l'analyse des données, et savoir l'intégrer à un environnement Hadoop.

2 100 € HT

Pour connaître les prochaines dates disponibles, en présentiel ou à distance, contactez-nous.

Contactez-nous

Présentation R

  • Le projet R Programming
  • Calculs statistiques et génération de graphiques
  • Points forts de R Programming
  • Besoins du Big Data
  • Positionnement de R Programming par rapport à Hadoop

Mise en oeuvre de R

  • Installation et tests sur une plateforme CentOS
    • Utilisation de R en mode commande
    • Commandes de base
    • Syntaxe
    • Opérations de base
    • Expressions
    • Manipulations de nombres, vecteurs, tableaux, matrices, listes...

    Tableaux et matrices

    • Déclaration, dimensionnement, indexation
    • Opérations de base
      • Produits de tableaux
      • Transposition
      • Produits de matrices
    • Matrices
      • Equations linéaires
      • Inversion
      • Valeur propre
      • Vecteur propre
      • Déterminant
      • Moindre carré

    Liste et DataFrames

    • Définitions et cas d'utilisation
    • Attachement et détachement
    • Chargement d'un DataFrame
    • La fonction Scan

    Statistiques

    • Distributions embarquées
      • Uniforme
      • Normale
      • Poisson
      • Exponentielle
    • Calculs statistiques
    • Modèles statistiques
    • Affichage en graphes et histogrammes

    Import / export

    • Formats texte, CSV, XML, binaire, largeur fixe, images (JPEG, PNG)
    • Encodage
    • Filtrage
    • Importation SQL
    • Importation depuis un réseau socket
    • Importation de données géodésiques
    • Exportation au format JSON

    Intégration Hadoop

    • Association de la puissance du calcul distribué fourni par les outils Hadoop
    • Différents moyens d'intégration pour utiliser le système distribué HDFS depuis R et pour accéder à HBase depuis les programmes en R
      • SparkR
      • RHBase
      • RHDFS
      • RHadoop
      • rmr2
    • Transformation d'un DataFrame R en un DataFrame Spark
    • Travaux pratiques avec Hadoop

    Fonctions spécifiques

    • Définitions de nouvelles fonctions
    • Appels
    • Passage d'arguments
    • Construction d'une bibliothèque
    • Diffusion et installation avec R CMD INSTALL

    Evolutions

    • Les acteurs
      • IBM avec BigInsights
      • Revolution R avec ScaleR

    Faites évoluer vos compétences

    Complétez votre formation