Apprentissage de métrique appliqué à la classification de textes par méthodes à noyaux

نویسندگان

  • Jean-Baptiste Pothin
  • Cédric Richard
چکیده

Résumé – Dans cet article, nous proposons une méthode pour l’optimisation de la métrique d’un classifieur textuel à noyaux. Contrairement aux techniques populaires existantes, notre approche ne nécessite pas la définition explicite de règles sémantiques. Etant donné un ensemble d’apprentissage, l’algorithme proposé permet d’optimiser la matrice sémantique, sans qu’il soit nécessaire d’exhiber celle-ci. Les résultats expérimentaux montrent l’efficacité et l’utilité de la méthode proposée en classification de textes par SVM (Support Vector Machines).

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage: cours 2 Méthodes par moyennage local - Consistance des méthodes par partition

On considère la régression au sens des moindres carrés avec des entrées dans X = R et des sorties réelles bornées : Y = [−B,B] pour B > 0 et `(y, y′) = (y − y′)2. Une fonction cible est donc f(x) = E[Y |X = x]. On considère un ensemble d’entrâınement Dn = {(X1, Y1), . . . , (Xn, Yn)}. Principe des méthodes par moyennage local : Prédire par la moyenne pondérée des Yi pour des Xi voisins de x. On...

متن کامل

Méthodes à noyaux appliquées aux textes structurés

Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...

متن کامل

Proposition d’un cadre méthodologique d’évaluation des systèmes d’assistance à la saisie de textes : Applications aux systèmes Sibylle et VITIPI

1 Pendant son post-doctorat à l’IRIT Résumé : Après un rappel sur les besoins des systèmes d’aide à la saisie de texte pour les personnes handicapées, cet article pose le problème de leur évaluation. En effet, si plusieurs de ces systèmes existent au niveau de la recherche, tous sont évalués dans des cadres, sur des textes et avec des métriques différentes. C’est pourquoi, après un bref passage...

متن کامل

Filtrage bayésien de la récompense

Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007