Découvrez notre formationProgrammation R et intégration Big Data
Présentiel
3 jours (21 heures) - BIG-ENVR
Accueil › Formations Informatique › Big Data › Data Science › Programmation R et intégration Big Data
Objectifs pédagogiques
- Maîtriser les principales fonctions statistiques de R
- Utiliser des programmes R dans un environnement Big Data, en s'appuyant sur le système distribué HDFS.
Niveau requis
Avoir des notions de calculs statistiques.
Public concerné
Chefs de projets, data scientists, statisticiens, développeurs souhaitant comprendre les apports de R pour l'analyse des données, et savoir l'intégrer à un environnement Hadoop.
Paris27/04/20202 100 € HTDates proposées dans les agences M2i
Paris06/07/20202 100 € HTDates proposées dans les agences M2i
Paris19/10/20202 100 € HTDates proposées dans les agences M2i
Paris25/11/20202 100 € HTDates proposées dans les agences M2i
Sessions
planifiéesSessions
ouvertesSessions
confirméesRéserver
le stage
Programme
3 jours (21 heures)
Présentation R
- Le projet R Programming
- Calculs statistiques et génération de graphiques
- Points forts de R Programming
- Besoins du Big Data
- Positionnement de R Programming par rapport à Hadoop
Mise en oeuvre de R
- Installation et tests sur une plateforme CentOS
- Utilisation de R en mode commande
- Commandes de base
- Syntaxe
- Opérations de base
- Expressions
- Manipulations de nombres, vecteurs, tableaux, matrices, listes...
Tableaux et matrices
- Déclaration, dimensionnement, indexation
- Opérations de base
- Produits de tableaux
- Transposition
- Produits de matrices
- Matrices
- Equations linéaires
- Inversion
- Valeur propre
- Vecteur propre
- Déterminant
- Moindre carré
Liste et DataFrames
- Définitions et cas d'utilisation
- Attachement et détachement
- Chargement d'un DataFrame
- La fonction Scan
Statistiques
- Distributions embarquées
- Uniforme
- Normale
- Poisson
- Exponentielle
- Calculs statistiques
- Modèles statistiques
- Affichage en graphes et histogrammes
Import / export
- Formats texte, CSV, XML, binaire, largeur fixe, images (JPEG, PNG)
- Encodage
- Filtrage
- Importation SQL
- Importation depuis un réseau socket
- Importation de données géodésiques
- Exportation au format JSON
Intégration Hadoop
- Association de la puissance du calcul distribué fourni par les outils Hadoop
- Différents moyens d'intégration pour utiliser le système distribué HDFS depuis R et pour accéder à HBase depuis les programmes en R
- SparkR
- RHBase
- RHDFS
- RHadoop
- rmr2
- Transformation d'un DataFrame R en un DataFrame Spark
- Travaux pratiques avec Hadoop
Fonctions spécifiques
- Définitions de nouvelles fonctions
- Appels
- Passage d'arguments
- Construction d'une bibliothèque
- Diffusion et installation avec R CMD INSTALL
Evolutions
- Les acteurs
- IBM avec BigInsights
- Revolution R avec ScaleR