PRINCE: Extraction optimisée des bases génériques de règles sans calcul de fermetures

نویسندگان

  • Tarek Hamrouni
  • Sadok Ben Yahia
  • Yahya Slimani
چکیده

The problem of the relevance and the usefulness of extracted association rules is becoming of primary importance, since an overwhelming number of association rules may be derived even from reasonably sized databases. This requires the extraction of generic bases of association rules, of reduced size and which summarize the same information. Using the concept of minimal generator, we propose an algorithm, called PRINCE, allowing an optimized extraction of the generic bases of rules. To this end, PRINCE builds the partial order. Its originality is that this partial order is maintained between minimal generators and no more between closed itemsets. A structure called minimal generator lattice is then built, from which the derivation of the generic association rules becomes straightforward. An experimental evaluation, carried out on benchmarking sparse and dense datasets, have shown that the proposed approach largely outperforms the pioneer algorithms CLOSE, ACLOSE and TITANIC. MOTS-CLÉS : fouille de données, théorie des concepts formels, base générique de règles, treillis des générateurs minimaux.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Efficient construction of the lattice of frequent closed patterns and simultaneous extraction of generic bases of rules

RÉSUMÉ – Durant ces dernières années, les quantités de données collectées, dans divers domaines d’application de l’informatique, deviennent de plus en plus importantes. Ces quantités suscitent le besoin d’analyse et d’interprétation afin d’en extraire des connaissances utiles. Dans ce travail, nous nous intéressons à la technique d’extraction des règles d’association à partir de larges contexte...

متن کامل

Les itemsets essentiels fermés : une nouvelle représentation concise

Résumé. Devant l’accroissement constant des grandes bases de données, plusieurs travaux de recherche en fouille de données s’orientent vers le développement de techniques de représentation compacte. Ces recherches se développent suivant deux axes complémentaires : l’extraction de bases génériques de règles d’association et l’extraction de représentations concises d’itemsets fréquents. Dans ce p...

متن کامل

Extraction de propriétés correctes dans des bases de données incomplètes

Résumé : Les valeurs manquantes dans les bases de données posent de nombreuses difficultés lors de processus d’extraction de connaissances et les propriétés extraites sont parfois incorrectes. Nous proposons à l’aide de calculs menés dans une base incomplète de caractériser des propriétés de la base complète dont la base de calcul est issue. Les propriétés de k-liberté sont étudiées, elles sont...

متن کامل

Closed Set Based Discovery of Small Covers for Association Rules

In this paper, we address the problem of the usefulness of the set of discovered association rules. This problem is important since real-life databases yield most of the time several thousands of rules with high confidence. We propose new algorithms based on Galois closed sets to reduce the extraction to small covers (or bases) for exact and approximate rules, adapted from lattice theory and da...

متن کامل

Une méthode de classification supervisée sans paramètre pour l'apprentissage sur les grandes bases de données

Résumé. Dans ce papier, nous présentons une méthode de classification supervisée sans paramètre permettant d’attaquer les grandes volumétries. La méthode est basée sur des estimateurs de densités univariés optimaux au sens de Bayes, sur un classifieur Bayesien naïf amélioré par une sélection de variables et un moyennage de modèles exploitant un lissage logarithmique de la distribution a posteri...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005