Apprentissage de SVM sur Données Bruitées
نویسندگان
چکیده
Après avoir exhibé un exemple basique montrant que les SVM à marges douces (CSVM) ne sont pas tolérantes au bruit de classification uniforme, nous proposons une version modifiée de CSVM basée sur une fonction objectif utilisant un estimateur des slack variables du problème non bruité. Les bonnes propriétés de cet estimateur sont appuyées par une analyse théorique ainsi que par des simulations numériques effectuées sur un jeu de données synthétique. Mots-clés : Classification Supervisée, Séparateurs linéaires, Machines à Vecteurs de Support, Bruit de Classification Uniforme
منابع مشابه
Sélection de variables en apprentissage d'ordonnancement. Évaluation des SVM pondérés
RÉSUMÉ. Sélectionner les caractéristiques les plus utiles et les moins redondantes au sein des fonctions d’ordonnancement et réduire les temps d’exécution sont des enjeux en apprentissage d’ordonnancement. Les algorithmes de sélection de variables basés sur les SVM régularisés sont des approches prometteuses dans ce cadre. Dans cet article, nous proposons de nouvelles méthodes de sélection de v...
متن کاملApprentissage incrémental avec peu de données pour la reconnaissance de caractères manuscrits en-ligne Incremental Learning with Few Data for online Handwritten Character Recognition
and key words
متن کاملSéparateurs à Vaste Marge Optimisant la Fonction Fbeta
Dans cet article, nous introduisons une nouvelle paramétrisation des Séparateurs à Vaste Marge (SVM) appelée Fβ SVM. Cette dernière permet d’effectuer un apprentissage basé sur l’optimisation de la fonction Fβ au lieu de l’erreur de classification habituelle. Les expériences montrent les avantages d’une telle démarche par rapport à la formulation soft-margin standard (avec les écarts à la marge...
متن کاملLecture Séquentielle de Documents pour la Classification
RÉSUMÉ. Nous proposons un nouveau modèle de lecture séquentielle permettant la classification automatique de documents textuels. Il est basé sur la modélisation d’un agent qui lit un document phrases après phrases et qui peut à tout moment décider d’associer un document à une ou plusieurs catégories données. L’algorithme proposé se base sur une formalisation de la classification de texte en tan...
متن کاملVers des Machines à Vecteurs Support "Actionnables" : Une Approche Fondée sur le Classement
Résumé. Une des principales critiques que l’on puisse faire aux Séparateurs à Vaste Marge (SVM) est le manque d’intelligibilité des résultats. En effet, il s’agit d’une technique “boite noire” qui ne fournit pas d’explications ni d’indices quant aux raisons d’une classification. Les résultats doivent être pris tels quels en faisant confiance au système qui les a produits. Pourtant selon notre e...
متن کامل