Fusion de données redondantes : une approche explicative
نویسندگان
چکیده
Résumé. Nous nous intéressons, dans le cadre du projet ANR Qualinca au traitement des données redondantes. Nous supposons dans cet article que cette redondance a déjà été établie par une étape préalable de liage de données. La question abordée est la suivante : comment proposer une représentation unique en fusionnant les "duplicats" identifiés ? Plus spécifiquement, comment décider, pour chaque propriété de la donnée considérée, quelle valeur choisir parmi celles figurant dans les "duplicats" à fusionner ? Quelle méthode adopter dans le but de pouvoir, par la suite, retracer et expliquer le résultat obtenu de façon transparente et compréhensible par l’utilisateur ? Nous nous appuyons pour cela sur une approche de décision multicritère et d’argumentation.
منابع مشابه
Nouvelle Approche de Corrélation d'Alertes basée sur la Fouille Multidimensionnelle
Résumé. En réponse aux problèmes posés par la complexité croissante des réseaux et des attaques, les Systèmes de Détection d’Intrusions (SDIs) constituent une bonne alternative pour mieux sécuriser un système informatique. Cependant, les SDIs existants présentent des lacunes en terme de génération excessive d’alertes. Réellement, la majorité de ces alertes ne correspondent pas à des attaques (f...
متن کاملDynaClose : Une approche de data mining pour la sélection des index de jointure binaires dans les entrepôts de données
Résumé. L’indexation est l’une des techniques d'optimisation redondantes qui accélère les requêtes OLAP. Deux types d’index sont disponibles : les mono-index (B-tree, index binaire, projection, etc.) et les multi-index (index de jointure). Pour un entrepôt représenté par un schéma en étoile, les index de jointure binaires sont souvent utilisés pour accélérer les requêtes de jointure en étoile c...
متن کاملClustering par Fusion Floue de Données Appliqué à la Segmentation d'Images IRM Cérébrales
Résumé. Dans cet article nous proposons une approche originale basée sur les techniques de data mining pour l’extraction des connaissances par fusion floue de données. Cette approche présente une nouvelle architecture de fusion de données basée sur la théorie possibiliste pour la segmentation d’une cible à partir de plusieurs sources d’images. Le processus de fusion est décomposé en trois phase...
متن کاملComment fusionner des ontologies avec la réécriture de graphes ?
RÉSUMÉ. Au cours de ces dernières années, les ontologies se sont imposées comme un outil incontournable de représentation des connaissances. Cette popularité a conduit au développement d’ontologies similaires ou partiellement redondantes. Cette multiplication de ressources disponibles a mené aux études traitant de leur réutilisation et/ou leur fusion. Dans ce contexte, nous proposons une nouvel...
متن کاملExtension de l'étiquetage géographique des pixels d'une image par fouille de données
Résumé. Les techniques de classification modernes permettent d’étiqueter les zones non couvertes des bases de données cartographiques, mais souffrent d’un manque de robustesse important. Dans cet article, nous proposons une méthode robuste d’extension d’étiquetage sur l’emprise d’une image satellite, par analyse hiérarchique des données existantes. Notre approche est fondée sur une sélection d’...
متن کامل