Fouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure
نویسندگان
چکیده
Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en compte certaines spécificités des cubes de données (e.g. multidimensionnalité, hiérarchies, relation d’ordre), aucune méthode ne permet de prendre directement en compte la valeurs des agrégats (mesure) dans l’extraction des motifs. Dans cet article, nous définissons deux méthodes de comptage du support d’une séquence multidimensionnelle en s’appuyant sur les valeurs des agrégats des cellules qui supportent cette séquence. Des expérimentations sont décrites et montrent l’intérêt de notre proposition.
منابع مشابه
La prise en compte de la dimension temporelle dans la classification de données
Résumé. Dans un contexte d’ingénierie de la connaissance, l’analyse des données relationnelles évolutives est une question centrale. La représentation de ce type de données sous forme de graphe optimisé en facilite l'analyse et l'interprétation par l’utilisateur non expert. Cependant, ces graphes peuvent rapidement devenir trop complexes pour être étudiés dans leur globalité, il faut alors les ...
متن کاملComparabilité de corpus et fouille terminologique multilingue
RÉSUMÉ. Les principaux travaux en fouille textuelle privilégient communément la taille du corpus sur sa qualité. Ainsi dans le cadre de l’alignement lexical à partir de corpus comparables, les meilleurs résultats sont obtenus pour des corpus de grande taille (plusieurs millions de mots). Pour les domaines de spécialité, et pour de nombreuses paires de langues, il n’est pas possible de disposer ...
متن کاملFouille de motifs séquentiels pour l'élicitation de stratégies à partir de traces d'interactions entre agents en compétition
Résumé. Pour atteindre un but, tout agent en compétition élabore inévitablement des stratégies. Lorsque l’on dispose d’une certaine quantité de traces d’interactions entre agents, il est naturel d’utiliser la fouille de motifs séquentiels pour découvrir de manière automatique ces stratégies. Dans cet article, nous proposons une méthodologie qui permet l’élicitation de stratégies et leur capacit...
متن کاملPersonnalisation du contenu des bases de données multidimensionnelles
Résumé. Les systèmes OLAP se basent généralement sur des Bases de Données Multidimensionnelles (BDM) qui représentent des extractions de l’entrepôt, dédiées à des groupes de décideurs. Les utilisateurs d’un même groupe ont souvent différentes perceptions du contenu d’une BDM. Nous proposons un cadre de personnalisation pour les systèmes de gestion des BDMs basé sur des profils utilisateurs. Ces...
متن کاملSimilarité en intension vs en extension : à la croisée de l'informatique et du théâtre
La mise en scène de théâtre traditionnelle repose sur une approche formelle de la similarité s’appuyant sur des ontologies dramaturgiques et des variations d’instanciation. Inspirés par la fouille de données numériques interactive, qui suggère des approches différentes, nous rendons compte de recherches théâtrales utilisant l’ordinateur comme partenaire de l’acteur pour échapper à la spécificat...
متن کامل