[wpms_breadcrumb reverse="0"]
Les tendances du BIG DATA

Réaliser des analyses Big Data avec Microsoft R

Reference : MS20773
3 jours - 1795 € HT
Prochaines sessions

Nous consulter.

Réaliser des analyses Big Data avec Microsoft R
Objectifs

  • Pouvoir expliquer comment Microsoft R Server et Microsoft R Client fonctionnent
  • Apprendre à utiliser R Client avec R Server pour explorer des données contenues dans différents magasins de données
  • Être capable de visualiser les données en utilisant des graphiques
  • Comprendre comment transformer et nettoyer des ensembles de données
  • Savoir mettre en oeuvre des options pour diviser les travaux d’analyse en tâches parallèles
  • Pouvoir construire et évaluer les modèles de régression générés à partir des données
  • Être en mesure de créer, marquer et déployer des modèles de partition générés à partir de données
  • Apprendre à utiliser R dans les environnements SQL Server et Hadoop

Pré requis

  • Avoir suivi la formation « Les fondamentaux de l’analyse statistique avec R » (BI103) ou disposer des connaissances équivalentes
  • Connaissance des méthodes statistiques et des meilleures pratiques d’analyse de données
  • Connaissances de Windows et de ses fonctionnalités principales
  • Connaissance pratique des bases de données relationnelles

Modalités pédagogiques

Cours dispensé en mode présentiel avec une alternance d’apports théoriques et méthodologiques, et de mises en situations pratiques

Public visé
Inscription

Programmes de Réaliser des analyses Big Data avec Microsoft R

MICROSOFT R SERVER ET R CLIENT

  • Qu’est-ce qu’un serveur Microsoft R
  • Utilisation du client Microsoft R
  • Les fonctions ScaleR

EXPLORER DE GRANDES DONNÉES

  • Comprendre les sources de données ScaleR
  • Lecture de données dans un objet XDF
  • Résumer des données dans un objet XDF

VISUALISATION D’UN GRAND NOMBRE DE DONNÉES

  • Visualisation des données en mémoire
  • Visualisation d’un grand nombre de données

TRAITEMENT D’UN GRAND NOMBRE DE DONNÉES

  • Transformer un grand nombre de données
  • Gestion d’un ensemble de données

OPÉRATIONS D’ANALYSE EN PARALLÈLE

  • Utilisation du contexte de calcul RxLocalParallel avec rxExec
  • Utilisation du package revoPemaR

CRÉATION ET ÉVALUATION DE MODÈLES DE RÉGRESSION

  • Clustering Big Data
  • Générer des modèles de régression et faire des prédictions

CRÉATION ET ÉVALUATION DE MODÈLES DE PARTITIONNEMENT

  • Création de modèles de partitionnement basés sur des arbres de décision
  • Tester les modèles de partitionnement en effectuant et en comparant des prédictions

TRAITEMENT D’UN GRAND NOMBRE DE DONNÉES DANS SQL SERVER ET HADOOP

  • Utilisation de R dans SQL Server
  • Utilisation de Hadoop Map / Reduce
  • Utilisation de Hadoop Spark
COVID – 19

Informations importantes concernant la situation actuelle

En savoir en plus