Une structure basée sur les hiérarchies pour synthétiser les itemsets fréquents extraits dans des fenêtres temporelles

نویسندگان

  • Yoann Pitarch
  • Anne Laurent
  • Pascal Poncelet
چکیده

Résumé. Le paradigme des flots de données rend impossible la conservation de l’intégralité de l’historique d’un flot qu’il faut alors résumer. L’extraction d’itemsets fréquents sur des fenêtres temporelles semble tout à fait adaptée mais l’amoncellement des résultats indépendants rend impossible l’exploitation de ces résultats. Nous proposons une structure basée sur les hiérarchies des données afin d’unifiant ces résultats. De plus, puisque la plupart des données d’un flot présentent un caractère multidimensionnel, nous intégrons la prise en compte d’itemsets multidimensionnels. Enfin, nous pallions une faiblesse majeure des Tilted Time Windows (TTW) en prenant en compte la distribution des données.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Le FIA: un nouvel automate permettant l'extraction efficace d'itemsets fréquents dans les flots de données

Résumé. Nous présentons dans cet article un nouvel automate : le FIA (Frequent Itemset Automaton) pour traiter de façon efficace la problématique de l’extraction des itemsets fréquents dans les flots de données. Le FIA est une structure de données très compacte et informative qui présente également des propriétés incrémentales intéressantes pour les mises à jour avec une granularité très fine. ...

متن کامل

Une approche de classification non supervisée basée sur la détection de singularités et la corrélation de séries temporelles pour la recherche d'états : application à un bioprocédé fed-batch

Résumé. Nous proposons dans cet article une méthode de clustering qui combine l’analyse dynamique et l’analyse statistique pour caractériser des états. Il s’agit d’une méthode de fouille de données qui travaille sur des ensembles de séries temporelles pour détecter des états; ces états représentent les informations les plus significatives du système. L’objectif de cette méthode non supervisée e...

متن کامل

Des motifs séquentiels généralisés aux contraintes de temps étendues

Résumé. Dans de nombreux domaines, la recherche de connaissances temporelles est très appréciée. Des techniques ont été proposées aussi bien en fouille de données qu’en apprentissage, afin d’extraire et de gérer de telles connaissances, en les associant également à la spécification de contraintes temporelles (e.g.: fenêtre temporelle maximale), notamment dans le contexte de la recherche de moti...

متن کامل

Une approche de représentation de l'information en RI basée sur les sousarbres

RÉSUMÉ. Ce papier propose une approche de recherche d’information basée sur l’utilisation d’une structure conceptuelle pour indexer les documents. La structure conceptuelle est hiérarchique. Elle est représentée par un sous-arbre pondéré. Un sous-arbre est obtenu d’abord en projetant document et requête sur une ressource conceptuelle externe, puis en appliquant une méthode de complétion via des...

متن کامل

Clusters dans les réseaux sociaux : intersections entre liens conceptuels fréquents et communautés

Résumé. La recherche de liens conceptuels fréquents (FCL) est une nouvelle approche de clustering de réseaux, qui exploite à la fois la structure et les attributs des noeuds. Bien que les travaux récents se soient déjà intéressés à l’optimisation des algorithmes de recherche des FCL, peu de travaux sont aujourd’hui menés sur la complémentarité qui existe entre les liens conceptuels et l’approch...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010