Entreposage et fouille de données
Description
Modèles prévisionnels et systèmes de gestion de l'entreprise
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Méthodologies de Data Mining
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen, Règles d'association
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision, forêts aléatoires, Réseaux de neurones, deep learning
- Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles - Données multivues - Images et Multimedia
Outils :
- Environnements freeware : R, Python
- Outils spécifiques : SAS-EM, SPAD
- Data Mining et bases de données : OLAP Business Object
Description des modalités d'évaluation
L'évaluation s'effectuera à la fois :
- sous la forme d'un examen sur table pour la partie cours
- sous la forme d'un projet consistant en une fouille de données pour la partie pratique
Public
être admis en M2 du master STIC, mention statistique ou être agréé.
La demande d'agrément est à faire uniquement pour les auditeurs qui souhaitent suivre STA211 en présentiel au semestre 1. Pour obtenir l'agrément, les auditeurs adresseront, à partir du 25 Août, par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit . Une réponse sera donnée dans un délai d'une dizaine de jours.
Niveau requis : NFA008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.
- Nombre d’ECTS
- 9
- Durée en nombre d'heures
- 90.00
- Type de notation
- Notation chiffrée (sur 20)
- Moyenne pour valider l'UE
- 10.00
- Modalité(s) d'évaluation
- Examen final
- Mémoire
- Projet(s)
- Année de création
- 2017
- Date de début de validité
- Date de fin de validité
- Déployabilité
- Offre déployable dans le réseau en cas d'agrément
- Examen national
- Oui
- Certificat de spécialisation Analyste de données massives
- Certificat de spécialisation Bio-informatique avancée
- Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
- Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
Cette unité fait partie du/des bloc(s) de compétences suivant(s).