Analyse de dissimilarités par arbre d'induction
نویسندگان
چکیده
Résumé. Dans cet article, nous considérons des objets pour lesquels nous disposons d’une matrice des dissimilarités et nous nous intéressons à leurs liens avec des attributs. Nous nous centrons sur l’analyse de séquences d’états pour lesquelles les dissimilarités sont données par la distance d’édition. Toutefois, les méthodes développées peuvent être étendues à tout type d’objets et de mesure de dissimilarités. Nous présentons dans un premier temps une généralisation de l’analyse de variance (ANOVA) pour évaluer le lien entre des objets non mesurables (p. ex. des séquences) avec une variable catégorielle. La clef de l’approche est d’exprimer la variabilité en termes des seules dissimilarités ce qui nous permet d’identifier les facteurs qui réduisent le plus la variabilité. Nous présentons un test statistique général qui peut en être déduit et introduisons une méthode originale de visualisation des résultats pour les séquences d’états. Nous présentons ensuite une généralisation de cette analyse au cas de facteurs multiples et en discutons les apports et les limites, notamment en terme d’interprétation. Finalement, nous introduisons une nouvelle méthode de type arbre d’induction qui utilise le test précédent comme critère d’éclatement. La portée des méthodes présentées est illustrée à l’aide d’une analyse des facteurs discriminant le plus les trajectoires occupationnelles .
منابع مشابه
TraMineR: une librairie R pour l'analyse de données séquentielles
TraMineR est une librairie pour l'environnement statistique R destinée à la fouille, la description et la visualisation de séquences d'états ou d'événements, et plus généralement de données séquentielles discrètes. La librairie est librement disponible sur le CRAN http://cran.r-project.org. Elle est principalement conçue pour l'analyse de données biographiques longitu-dinales dans le domaine de...
متن کاملSystème D'Indexation et de Recherche d'Images par le Contenu
Dans cet article, nous présentons un système d’indexation et de recherche d’images par le contenu Requit. Chaque image est représentée par un arbre quaternaire et notre base d’images est stockée en une structure de données appelée arbre quaternaire générique. Ce dernier permet de minimiser l’espace de stockage par partage d’informations entre les images et facilite les opérations entre elle.
متن کاملAccélération des cartes auto-organisatrices sur tableau de dissimilarités par séparation et évaluation
Résumé. Dans cet article, nous proposons une nouvelle implémentation d’une adaptation des cartes auto-organisatrices de Kohonen (SOM) aux tableaux de dissimilarités. Cette implémentation s’appuie sur le principe de séparation et évaluation afin de réduire le temps de calcul global de l’algorithme. Une propriété importante de ce nouvel algorithme tient au fait que les résultats produits sont str...
متن کاملExplications conviviales pour la programmation par contraintes
RÉSUMÉ. Dans cet article, nous présentons un ensemble d’outils pour fournir des explications conviviales dans un système de programmation par contraintes avec explications. L’idée est de représenter les contraintes d’un problème sous forme hiérarchique (un arbre). Les utilisateurs sont alors représentés comme un ensemble de noeuds compréhensibles dans cet arbre (une coupe). Les explications cla...
متن کاملAsymptotic analysis of magnetic induction with high frequency for Solid Conducteurs
In this paper we describe the behaviour both in time and in space of an induction eld created by an imposed high frequency alternating current around a solid conductor. To do this, we introduce two time scales and we decompose the induction eld in a mean eld and an oscillating eld. With the help of singular perturbations theory and multiple scales method we obtain two uncoupled models; one for ...
متن کامل