Laboratoire ERIC, salle K071 à 10h30
Résumé: La prolifération de données et leur production à grande échelle pose de nouveaux défis quant leur analyse en ligne, à cause notamment de la multiplicité des modèles de stockage l’absence de schéma pour certaines données. Les lacs de données permettent, selon le processus ELT, de stocker les données pour les exploiter ultérieurement, en permettant par exemple de concevoir des structures d’analyse en ligne (cube OLAP). Nous présentons une approche de conception et d’enrichissement de cubes OLAP à partir de sources de données caractérisées notamment par la multiplicité de modèles de stockage. L’activité de conception est guidée par les métadonnées qui décrivent la structure et la sémantique des sources et elle permet de résoudre, entre autres, les problèmes de duplication des données à travers ces sources. De même, l’activité enrichissement est guidée par les métadonnées, et elle permet d’augmenter le cubes à partir des sources, afin de découvrir l’existence d’éventuelles corrélations.