Repérage de mots informatifs dans les textes conversationnels

نویسنده

  • Narjès Boufaden
چکیده

RÉSUMÉ. Nous présentons les résultats d’une approche d’étiquetage sémantique développée pour le repérage de mots informatifs à partir de textes conversationnels. Ce travail entre dans le cadre du développement d’un système d’extraction d’information dans le domaine de la recherche et sauvetage maritime. Il s’agit de détecter et d’annoter les mots pertinents avec des étiquettes sémantiques correspondant aux concepts d’une ontologie du domaine. Notre méthode combine une approche symbolique basée sur un automate à états finis et une approche statistique exploitant deux types d’information : les vecteurs de scores de similarité et le contexte discursif représenté par le thème. Le F-score obtenu sur des transcriptions manuelles de conversations téléphoniques dans le domaine de la recherche et sauvetage maritime est de 82,2 %.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Degré de relation sémantique dans une ontologie pour la commande en langue naturelle

Résumé : Dans la communication homme-machine en langue naturelle, le système doit être capable d’associer les termes de l’utilisateur avec les concepts manipulés par l’agent artificiel. Dans cet article, nous proposons une mesure de degré de relation sémantique entre deux concepts d’une ontologie pour faciliter cette phase dite « d’interprétation sémantique ». Nous proposons une généralisation ...

متن کامل

Défi EGC 2016 : Analyse par Motifs Fréquents et Topic Modeling

Résumé. Dans le domaine de l’analyse de textes, l’extraction de motifs est une technique très populaire pour mettre en évidence des relations fréquentes entre les mots. De même, les techniques de topic modeling ont largement fait leurs preuves lorsqu’il s’agit de classer automatiquement des ensembles de textes partageant des thématiques similaires. Ainsi, ce papier a pour ambition de montrer l’...

متن کامل

Visualisation des motifs séquentiels extraits à partir d'un corpus en Ancien Français

Les travaux présentés dans cet article répondent aux besoins d’une experte médiéviste souhaitant découvrir des connaissances nouvelles dans un corpus de textes écrits en Ancien Français. Les connaissances extraites à partir de ce corpus sont sous forme de motifs séquentiels. Dans notre contexte, un motif séquentiel est une suite ordonnée d’itemsets (phrases). Un itemset est un ensemble d’items ...

متن کامل

Study of Domain Dependant Multi-Polarity Words for Document Level Opinion Mining (Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d'opinion au niveau du texte) [in French]

Résumé. Les méthodes de détection automatique de l’opinion dans des textes s’appuient sur l’association d’une polarité d’opinion aux mots des textes, par lexique ou par apprentissage. Or, certains mots ont des polarités qui peuvent varier selon le domaine thématique du texte. Nous proposons dans cet article une étude des mots ou groupes de mots marqueurs d’opinion au niveau du texte et qui ont ...

متن کامل

Un outil de détection automatique de thèmes

Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008