Fouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure

نویسندگان

  • Marc Plantevit
  • Anne Laurent
  • Maguelonne Teisseire
چکیده

Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en compte certaines spécificités des cubes de données (e.g. multidimensionnalité, hiérarchies, relation d’ordre), aucune méthode ne permet de prendre directement en compte la valeurs des agrégats (mesure) dans l’extraction des motifs. Dans cet article, nous définissons deux méthodes de comptage du support d’une séquence multidimensionnelle en s’appuyant sur les valeurs des agrégats des cellules qui supportent cette séquence. Des expérimentations sont décrites et montrent l’intérêt de notre proposition.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

La prise en compte de la dimension temporelle dans la classification de données

Résumé. Dans un contexte d’ingénierie de la connaissance, l’analyse des données relationnelles évolutives est une question centrale. La représentation de ce type de données sous forme de graphe optimisé en facilite l'analyse et l'interprétation par l’utilisateur non expert. Cependant, ces graphes peuvent rapidement devenir trop complexes pour être étudiés dans leur globalité, il faut alors les ...

متن کامل

Comparabilité de corpus et fouille terminologique multilingue

RÉSUMÉ. Les principaux travaux en fouille textuelle privilégient communément la taille du corpus sur sa qualité. Ainsi dans le cadre de l’alignement lexical à partir de corpus comparables, les meilleurs résultats sont obtenus pour des corpus de grande taille (plusieurs millions de mots). Pour les domaines de spécialité, et pour de nombreuses paires de langues, il n’est pas possible de disposer ...

متن کامل

Fouille de motifs séquentiels pour l'élicitation de stratégies à partir de traces d'interactions entre agents en compétition

Résumé. Pour atteindre un but, tout agent en compétition élabore inévitablement des stratégies. Lorsque l’on dispose d’une certaine quantité de traces d’interactions entre agents, il est naturel d’utiliser la fouille de motifs séquentiels pour découvrir de manière automatique ces stratégies. Dans cet article, nous proposons une méthodologie qui permet l’élicitation de stratégies et leur capacit...

متن کامل

Personnalisation du contenu des bases de données multidimensionnelles

Résumé. Les systèmes OLAP se basent généralement sur des Bases de Données Multidimensionnelles (BDM) qui représentent des extractions de l’entrepôt, dédiées à des groupes de décideurs. Les utilisateurs d’un même groupe ont souvent différentes perceptions du contenu d’une BDM. Nous proposons un cadre de personnalisation pour les systèmes de gestion des BDMs basé sur des profils utilisateurs. Ces...

متن کامل

Similarité en intension vs en extension : à la croisée de l'informatique et du théâtre

La mise en scène de théâtre traditionnelle repose sur une approche formelle de la similarité s’appuyant sur des ontologies dramaturgiques et des variations d’instanciation. Inspirés par la fouille de données numériques interactive, qui suggère des approches différentes, nous rendons compte de recherches théâtrales utilisant l’ordinateur comme partenaire de l’acteur pour échapper à la spécificat...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008