Sous-bases k-faibles pour des règles d'association valides au sens de la confiance

نویسندگان

  • Jean Diatta
  • Régis Girard
چکیده

L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart de ces bases se caractérisent en terme d’un opérateur de fermeture de Galois sur l’ensemble des motifs du contexte considéré. Or, cet opérateur de fermeture correspond à une famille de Moore m-faiblement hiérarchique, où m ≥ 2 est un entier (Diatta, 2004). Plus précisément, les fermés de cet opérateur de fermeture coïncident avec les classes faibles associées à une certaine mesure de dissimilarité m-voies et forment donc, de ce fait, la hiérarchie m-faible associée à cette mesure de dissimilarité. Dans cet article, nous considérons la caractérisation de ces bases pour les règles d’association, en remplaçant l’opérateur de fermeture de Galois par un opérateur de fermeture correspondant à la hiérarchie k-faible associée à une mesure de dissimilarité k-voies donnée, où 2 ≤ k ≤ m. Pour chaque valeur de k, l’ensemble de règles ainsi caractérisé sera appelé sousbase k-faible. Ces sous-bases k-faibles offrent une approximation de l’ensemble des règles valides, relativement à des ensembles d’items (classes k-faibles) ayant un certain degré d’homogénéité exprimé par le biais d’un indice d’isolation. Par ailleurs, la possibilité d’associer une sous-base (k−) faible à une mesure de dissimilarité (k-voies) permet d’intégrer la sémantique de cette mesure de dissimilarité dans le choix des règles à générer.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extension de l'algorithme Apriori et des règles d'association aux cas des données symboliques diagrammes et intervalles

Résumé. Nous traitons l’extension de l’algorithme Apriori et des règles d’association aux cas des données symboliques diagrammes et intervalles. La méthode proposée nous permet de découvrir des règles d’association au niveau des concepts. Cette extension implique notamment de nouvelles définitions pour le support et la confiance afin d’exploiter la structure symbolique des données. Au fil de l’...

متن کامل

Contrôle du risque multiple pour la sélection de règles d'association significatives

Résumé. Les algorithmes d'extraction de règles d'association parcourent e cacement le treillis des itemsets pour constituer une base de règles admissibles à des seuils de support et de con ance, mais donnent une multitude de règles peu exploitables. Nous suggérons d'épurer de telles bases en éliminant les règles non statistiquement signi catives. La multitude de tests pratiqués conduit mécaniqu...

متن کامل

Forage distribué des données : une comparaison entre l'agrégation d'échantillons et l'agrégation de règles

Résumé. Pour nous attaquer au problème du forage de très grandes bases de données distribuées, nous proposons d’étudier deux approches. La première est de télécharger seulement un échantillon de chaque base de données puis d’y effectuer le forage. La deuxième approche est de miner à distance chaque base de données indépendamment, puis de télécharger les modèles résultants, sous forme de règles ...

متن کامل

Utilisation de règles d'association pour la prédiction de valeurs manquantes

Résumé. Le traitement des valeurs manquantes est une problématique importante dans le domaine des entrepôts de données. Plusieurs solutions ont été proposées pour la prédiction de valeurs manquantes, présentant les caractéristiques suivantes : (i) la prédiction traite soit des valeurs continues soit des valeurs discrètes, et (ii) la prédiction est approximative (soit elle est associée à une pro...

متن کامل

Le forage distribué des données: une méthode simple, rapide et efficace

Résumé. Dans cet article nous nous attaquons au problème du forage de très grandes bases de données distribuées. Le résultat visé est un modèle qui soit et prédictif et descriptif, appelé méta-classificateur. Pour ce faire, nous proposons de miner à distance chaque base de données indépendamment. Puis, il s’agit de regrouper les modèles produits (appelés classificateurs de base), sachant que ch...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007