bg-header

Business Intelligence (1) - Data Warehouses

6 ECTS NFE211

Nombre de crédits
6 ECTS

Durée de la formation
60 heures

Modalité
-

objectifs de la formation

Acquérir une bonne connaissance de l'informatique décisionnelle (Business Intelligence), et en particulier de tous les processus liés à une architecture d'entrepôt de données (Data Warehouse).

Cette UE cible tout particulièrement la conception de l'entrepôt de données, la gestion du projet, et sa mise en œuvre, en particulier la mise en œuvre de la partie ETL.

Remarque : Pour une maitrise complète du processus, tant du point de vue gestion des données que du point de vue analyse des données (data Science) il est conseiller de suivre également le NFE212 (semestre 2) qui fait suite au NFE211 (semestre 1)

compétences et débouchés

Capacité d'intégration dans une équipe de développement de système d'information décisionnel. En particulier compétences en conception et exploitation d'entrepôts de données :


• Capacité à concevoir et implémenter la partie ETL d’un Data Warehouse

• Capacité à concevoir et implémenter des cubes décisionnels

• Capacité à concevoir dans sa totalité une chaîne décisionnelle

• Capacité à mettre en œuvre une chaîne décisionnelle à l’aide des outils du marché

• Capacité à exploiter une chaîne décisionnelle

• Capacité à gérer l'intégration des données

• Capacité à gérer un projet décisionnel

prérequis

Ce cours s'adresse aux auditeurs préparant le diplôme d'ingénieur informatique option système d'information et/ou aux étudiants suivant le Master STIC mention Informatique Spécialité Systèmes d'Information et de Décision
Prérequis : Bonnes connaissances en bases de données et en systèmes d'information.

programme de la formation

Introduction

• La Business Intelligence
• Business Intelligence et Big Data
• Objectifs d'un entrepôt de données
• OLAP versus OLTP

Architecture d'un entrepôt de données

• Architecture matérialisée /architecture médiateur
• Dualité Entrepôt / magasins, Architecture de Inmon, Architecture de Kimball
• Data Warehouse /Data Lake
• Self BI
• Les méta-données, gestion, standardisation CWMI

Modélisation multidimensionnelle

• La modélisation multidimensionnelle, faits, dimensions, hiérarchies, indicateurs
• Modèles OLAP, ROLAP, MOLAP, mixte
• Modélisation en étoile, en flocon, en constellation
• L'algèbre multidimensionnelle
• Les dimensions à changement lent
• Les différents types de table de faits (récapitulatifs, transactions)

Méthodes de modélisation d'un entrepôt de données

• Méthode par matrice
• Méthode par indicateurs
• Méthode MAP
• Méthode par analyse des requêtes
• Volumétrie, choix de la granularité, choix des Data Marts
• Méthodes de projets BI

Ingénierie d'extraction et d'intégration des données

• L’extraction des données
• Le nettoyage des données
• L'intégration sémantique des données
• Le rafraichissement des données
• Solution par programmation (Embedded SQL, déclencheurs)
• Solution par outils ETL

L’environnement technologique

• Outils ETL, Systèmes de gestion de bases de données OLAP, outils de modélisation multidimensionnelle
• Data Warehouse et Cloud,
• Data Warehouse et Big Data

Méthodes pédagogiques

Modalité Présentiel

Les cours en présentiel : ils ont lieu en présence des élèves et de l’enseignant dans un centre Cnam :

  • hors temps de travail (HTT)c'est à dire le soir (souvent à partir de 18h30) ou le samedi,
  • en journée (au rythme d'un cours par semaine ou bien de quelques journées bloquées dans le semestre).

Aucun cours n’est enregistré ni diffusé via Internet. La présence physique des élèves est nécessaire.

Les examens se déroulent exclusivement dans le centre Cnam où se déroulent les cours.

Modalité Hybride

La modalité hybride est une combinaison entre :

  • des regroupements en salle à présence physique indispensable (non diffusés via Internet et non enregistrés),
  • des webconférences régulières à présence fortement conseillée,
  • des activités distantes via la plateforme d’enseignement à distance pouvant prendre la forme de :
    • la mise à disposition de ressources pédagogiques formalisées (cours magistraux : notions et concepts),
    • des travaux à réaliser tutorés (activités pédagogiques : exercices, cas, lectures, rédaction de notes, de dossiers qui font écho aux ressources pédagogiques et/ou aux activités réalisées dans le cadre des regroupements physiques, forums …),
    • des travaux personnels non tutorés.

Modalité Foad

La modalité Foad est parfaitement adaptée à votre disponibilité :

  • des webconférences régulières à présence indispensable (accessibles en direct via internet, enregistrées pour visualisation en différé),
  • des activités distantes via la plateforme d’enseignement à distance pouvant prendre la forme de :
    • la mise à disposition de ressources pédagogiques (cours, exercices, cas),
    • des travaux à réaliser tutorés via la plateforme d’enseignement à distance,
    • des travaux personnels non tutorés.

méthode d'évaluation

L’UE sera validée par un examen final et par un projet réalisé individuellement, en binôme ou en trinôme.

Le projet - dont le sujet sera choisi par l’élève en accord avec le professeur - permettra de mettre en place une chaîne décisionnelle fondée sur les outils du marché (parmi l’offre industrielle ou celle du logiciel libre). Le projet peut aussi permettre d’approfondir un point théorique (par exemple la prise en compte du RGPD dans le Data Warehouse).

La note finale sera la moyenne de l'examen et du projet (avec la contrainte note examen >= 10).

Equivalences, passerelles & suite de parcours

En savoir plus sur les équivalences, passerelles & suite de parcours

financez votre formation

En savoir plus sur nos modes de financement


Mis à jour le : 21-04-2024
S'inscrire !