[wpms_breadcrumb reverse="0"]
Les tendances du BIG DATA

Réaliser des analyses Big Data avec Microsoft R

Reference : MS20773
3 jours - 1700€ € HT
Prochaines sessions

Nous consulter.

Réaliser des analyses Big Data avec Microsoft R
Objectifs

  • Pouvoir expliquer comment Microsoft R Server et Microsoft R Client fonctionnent
  • Apprendre à utiliser R Client avec R Server pour explorer des données contenues dans différents magasins de données
  • Être capable de visualiser les données en utilisant des graphiques
  • Comprendre comment transformer et nettoyer des ensembles de données
  • Savoir mettre en oeuvre des options pour diviser les travaux d’analyse en tâches parallèles
  • Pouvoir construire et évaluer les modèles de régression générés à partir des données
  • Être en mesure de créer, marquer et déployer des modèles de partition générés à partir de données
  • Apprendre à utiliser R dans les environnements SQL Server et Hadoop

Pré requis

  • Avoir suivi la formation « Les fondamentaux de l’analyse statistique avec R » (BI103) ou disposer des connaissances équivalentes
  • Connaissance des méthodes statistiques et des meilleures pratiques d’analyse de données
  • Connaissances de Windows et de ses fonctionnalités principales
  • Connaissance pratique des bases de données relationnelles

Modalités pédagogiques

Cours dispensé en mode présentiel avec une alternance d’apports théoriques et méthodologiques, et de mises en situations pratiques

Public visé

• Avoir de l’expérience dans l’utilisation du langage R et des packages communs ;
• Connaître les méthodes de statistiques courantes et les meilleures pratiques des analyses de données ;
• Avoir des connaissances de base sur le système d’exploitation Windows et ses fonctionnalités principales ;
• Travailler régulièrement sur des bases de données relationnelles

Inscription

Programmes de Réaliser des analyses Big Data avec Microsoft R

MICROSOFT R SERVER ET R CLIENT

  • Qu’est-ce qu’un serveur Microsoft R
  • Utilisation du client Microsoft R
  • Les fonctions ScaleR

EXPLORER DE GRANDES DONNÉES

  • Comprendre les sources de données ScaleR
  • Lecture de données dans un objet XDF
  • Résumer des données dans un objet XDF

VISUALISATION D’UN GRAND NOMBRE DE DONNÉES

  • Visualisation des données en mémoire
  • Visualisation d’un grand nombre de données

TRAITEMENT D’UN GRAND NOMBRE DE DONNÉES

  • Transformer un grand nombre de données
  • Gestion d’un ensemble de données

OPÉRATIONS D’ANALYSE EN PARALLÈLE

  • Utilisation du contexte de calcul RxLocalParallel avec rxExec
  • Utilisation du package revoPemaR

CRÉATION ET ÉVALUATION DE MODÈLES DE RÉGRESSION

  • Clustering Big Data
  • Générer des modèles de régression et faire des prédictions

CRÉATION ET ÉVALUATION DE MODÈLES DE PARTITIONNEMENT

  • Création de modèles de partitionnement basés sur des arbres de décision
  • Tester les modèles de partitionnement en effectuant et en comparant des prédictions

TRAITEMENT D’UN GRAND NOMBRE DE DONNÉES DANS SQL SERVER ET HADOOP

  • Utilisation de R dans SQL Server
  • Utilisation de Hadoop Map / Reduce
  • Utilisation de Hadoop Spark