Carte auto-organisatrice probabiliste sur données binaires
نویسندگان
چکیده
Résumé. Les méthodes factorielles d’analyse exploratoire statistique définissent des directions orthogonales informatives à partir d’un ensemble de données. Elles conduisent par exemple à expliquer les proximités entre individus à l’aide d’un groupe de variables caractéristiques. Dans le contexte du datamining lorsque les tableaux de données sont de grande taille, une méthode de cartographie synthétique s’avère intéressante. Ainsi une carte auto-organisatrice (SOM) est une méthode de partitionnement munie d’une structure de graphe de voisinage -sur les classesle plus souvent planaire. Des travaux récents sont développés pour étendre le SOM probabiliste Generative Topographic Mapping (GTM) aux modèles de mélanges classiques pour données discrètes. Dans ce papier nous présentons et étudions un modèle génératif symétrique de carte auto-organisatrice pour données binaires que nous appelons Bernoulli Aspect Topological Model (BATM). Nous introduisons un nouveau lissage et accélérons la convergence de l’estimation par une initialisation originale des probabilités en jeu.
منابع مشابه
Binary Block GTM : Carte auto-organisatrice probabiliste pour les grands tableaux binaires
Ce papier présente un modèle génératif et son estimation permettant la visualisation de données binaires. Notre approche est basée sur un modèle de mélange de lois de Bernoulli par blocs et les cartes de Kohonen probabilistes. La méthode obtenue se montre à la fois parcimonieuse et pertinente en pratique.
متن کاملClassification topologique probabiliste pour des données catégorielles
Cet article présente une carte auto-organisatrice probabiliste pour l’analyse et la classification topologique des données catégorielles. En considérant un modèle de mélanges parcimonieux nous introduisons une nouvelle carte auto-organisatrice (SOM) probabiliste. L’estimation des paramètres de notre modèle est réalisée à l’aide de l’algorithme EM classique. Contrairement à SOM, l’algorithme d’a...
متن کاملModèles de mélanges topologiques pour la classification de données catégorielles et mixtes
Résumé. Cet article présente une méthode basée sur les cartes auto-organisatrices probabilistes dédiées à la classification non supervisée et la visualisation de données catégorielles et des données mixtes contenant des composantes quantitatives et binaires. Pour chacun de ces types de données, nous proposons un formalisme probabiliste dans lequel les unités de la carte topologique sont représe...
متن کاملSegmentation hiérarchique des cartes topologiques
Résumé. Dans ce papier, nous présentons une nouvelle mesure de similarité pour la classification des référents de la carte auto-organisatrice qui sera réalisée à l’aide d’une nouvelle approche de classification hiérarchique. (1) La mesure de similarité est composée de deux termes : la distance de Ward pondérée et la distance euclidienne pondérée par la fonction de voisinage sur la carte topolog...
متن کاملApprendre les contraintes topologiques dans les cartes auto-organisatrices
Résumé. La Carte Auto-Organisatrice (SOM : Self-Organizing Map) est une méthode populaire pour l’analyse de la structure d’un ensemble de données. Cependant, certaines contraintes topologiques de la SOM sont fixées avant l’apprentissage et peuvent ne pas être pertinentes pour la représentation de la structure des données. Dans cet article nous nous proposons d’améliorer les performances des SOM...
متن کامل