Description
- Rania Assab : BIG DATA PROCESSING
Fondamentaux du Big Data et du Data Engineering
Extraction de Données d’un Système d’Information et utilisation d’ETL
Programmation Parallélisée et clusters de Calcul (Spark, Hadoop)
2. Alanna Devlin-Genin : DISTRIBUTED DATA SYSTEMS
Bases de données à grande échelle : modélisation et structuration
Bases de données NoSQL : illustration avec Cassandra
3. Audrey Duval : INFRASTRUCTURE DATA MANAGEMENT
Data Lakes et Data Warehouse. Sécurisation des données
Infrastructures et déploiement
Finalité
Le but est de présenter une synthèse des méthodes modernes de stockage, accès, structuration et exploitation de données, avec un accent mis sur les défis spécifiques pour les catégories de données utilisées en santé (données image, données structurées, etc.)
Des aspects essentiels sur la réglementation en santé comme la loi RGPD, la pseudomisation de données et la sécurisation des SI sont abordés tout au long du module.
Compétences visées
Comprendre les enjeux des entrepôts de données modernes dans le domaine de la santé
Comprendre la mise en place et l'utilisation des outils de base de l’ingénierie des données : interrogation SQL, outils pour les entrepôts de données massives, de bases de données à grande échelle et leur sécurisation.
Description des modalités d'évaluation
QCM, travaux pratiques et data challenges
Prérequis
Cet enseignement s'adresse à un public souhaitant se former à l’utilisation des outils modernes de gestion de données massives. Il est ouvert sans condition d’accès. Toutefois, de bonnes bases en informatique sont nécessaires pour bien suivre les cours.
- Nombre d’ECTS
- 6
- Modalité(s) d'évaluation
- Contrôle continu
- Examen final
- Date de début de validité
- Date de fin de validité
- Déployabilité
- Offre non déployable dans le réseau
Le certificateur est le Cnam