Un critère Bayésien pour évaluer la robustesse des règles de classification
نویسندگان
چکیده
Résumé. L’utilisation de règles de classification dans les modèles prédictifs a été très étudiée ces dernières années. La forme simple et interprétable des règles en font des motifs très populaires. Les classifieurs combinant des règles de classification intéressantes (selon une mesure d’intérêt) offrent de bonnes performances de prédictions. Cependant, les performances de ces classifieurs dépendent de la mesure d’intérêt (e.g., confiance, taux d’accroissement,. . . ) et du seuillage (non-trivial) de cette mesure pour déterminer les règles pertinentes. De plus, il est facile de montrer que les règles extraites ne sont pas individuellement robustes. Dans cet article, nous proposons un nouveau critère pour évaluer la robustesse des règles de classification dans les données Booléennes. Notre critère est issu d’une approche Bayésienne : nous proposons une expression analytique de la probabilité d’une règle connaissant les données. Ainsi, les règles les plus probables sont robustes. Le critère Bayésien nous permet alors d’identifier (sans paramètre) les règles robustes parmi un ensemble de règles données.
منابع مشابه
Mesure formelle de la robustesse des règles d'association
Résumé. Nous proposons dans cet article une définition formelle de la robustesse pour les règles d’association, s’appuyant sur une modélisation que nous avons précédemment définie. Ce concept est à notre avis central dans l’évaluation des règles et n’a à ce jour été que très peu étudié de façon satisfaisante. Il est crucial car malgré une très bonne évaluation par une mesure de qualité, une règ...
متن کاملConstruction itérative d'un modèle de connaissance par l'exploitation de règles d'association
Résumé Nous nous intéressons à la construction itérative d’un modèle de la connaissance experte par l’exploitation de règles descriptives telles que les règles d’associations. Nous avons montré que, lorsqu’il est disponible, un modèle de type réseau bayésien facilite la présentation de règles d’association pertinentes. Nous étudions maintenant les possibilités pour l’expert d’annoter ces règles...
متن کاملSélection supervisée d'instances : une approche descriptive
Résumé. La classification suivant le plus proche voisin est une règle simple et performante. Sa mise en oeuvre pratique nécessite, tant pour des raisons de coût de calcul que de robustesse, de sélectionner les instances à conserver. La partition de Voronoi induite par les prototypes constitue la structure sous-jacente à cette règle. Dans cet article, on introduit un critère descriptif d’évaluat...
متن کاملUn critère d'évaluation Bayésienne pour la construction d'arbre de décision
Résumé. Nous présentons dans cet article un nouvel algorithme automatique pour l’apprentissage d’arbres de décision. Nous abordons le problème selon une approche Bayésienne en proposant, sans aucun paramètre, une expression analytique de la probabilité d’un arbre connaissant les données. Nous transformons le problème de construction de l’arbre en un problème d’optimisation : nous recherchons da...
متن کاملCritère VT100 de sélection des règles d'association
Résumé. L’extraction de règles d’association génère souvent un grand nombre de règles. Pour les classer et les valider, de nombreuses mesures statistiques ont été proposées ; elles permettent de mettre en avant telles ou telles caractéristiques des règles extraites. Elles ont pour point commun d’être fonction croissante du nombre de transactions et aboutissent bien souvent à l’acceptation de to...
متن کامل