Utilisation de règles d'association pour la prédiction de valeurs manquantes
نویسندگان
چکیده
Résumé. Le traitement des valeurs manquantes est une problématique importante dans le domaine des entrepôts de données. Plusieurs solutions ont été proposées pour la prédiction de valeurs manquantes, présentant les caractéristiques suivantes : (i) la prédiction traite soit des valeurs continues soit des valeurs discrètes, et (ii) la prédiction est approximative (soit elle est associée à une probabilité soit elle concerne un ensemble de valeurs). Récemment, une méthode de prédiction permettant de traiter indépendamment les cas continu et discret a été proposée, en se basant sur les règles d’association. Cette méthode permet de prédire, avec une confiance toujours égale à 1, soit un ensemble de valeurs dans le cas discret, soit un intervalle de valeurs dans le cas continu. Dans cet article, nous reprenons cette approche basée sur l’extraction de règles d’association et nous montrons comment générer des règles de prédictions portant sur une unique valeur et dont la confiance est toujours égale à 1. Afin d’obtenir de telles règles, notre méthode suppose que l’on dispose d’une hiérarchie décrivant des concepts généralisant les valeurs qui peuvent être prédites.
منابع مشابه
Le rôle de l'utilisateur dans un processus d'extraction de règles d'association
Résumé. De nombreux travaux ont porté sur l'extraction de règles d'association. Cependant, cette tâche continue à intéresser les chercheurs en fouille de données car elle soulève encore plusieurs défis. En particulier, son utilisation en pratique reste difficile : d'une part, le nombre de règles apprises est souvent très grand, d'autre part, le traitement des valeurs numériques dans cette tâche...
متن کاملRecherche de dépendances fonctionnelles et de règles d'association avec OLAP
Dans l’étude des bases de données, il est intéressant de déceler les liens entre les attributs. Pour ça, plusieurs outils sont disponibles. Les Règles d’Association (RA) permettent de savoir quelles valeurs des attributs dépendent d’autres valeurs. Les Dépendances Fonctionnelles (DF) permettent de savoir quels attributs dépendent des autres. Les RA donnent des informations à un niveau de granul...
متن کاملReprésentation Symbolique de Trajectoires Géolocalisées
RESUME. Énormément de trajectoires géolocalisées sont produites et disponibles, mais leur exploitation pour en tirer des informations intéressantes reste difficile. L'obstacle qui nous intéresse ici est la mauvaise qualité de certaines de ces données : échantillonnage très irrégulier et précision médiocre. Nous proposons de les transposer dans des domaines symboliques pour pouvoir effectuer des...
متن کاملContrôle du risque multiple pour la sélection de règles d'association significatives
Résumé. Les algorithmes d'extraction de règles d'association parcourent e cacement le treillis des itemsets pour constituer une base de règles admissibles à des seuils de support et de con ance, mais donnent une multitude de règles peu exploitables. Nous suggérons d'épurer de telles bases en éliminant les règles non statistiquement signi catives. La multitude de tests pratiqués conduit mécaniqu...
متن کاملExtraction de propriétés correctes dans des bases de données incomplètes
Résumé : Les valeurs manquantes dans les bases de données posent de nombreuses difficultés lors de processus d’extraction de connaissances et les propriétés extraites sont parfois incorrectes. Nous proposons à l’aide de calculs menés dans une base incomplète de caractériser des propriétés de la base complète dont la base de calcul est issue. Les propriétés de k-liberté sont étudiées, elles sont...
متن کامل