Regroupement sémantique de définitions en espagnol

نویسندگان

  • Gerardo Sierra
  • Juan-Manuel Torres-Moreno
  • Alejandro Molina
چکیده

De nos jours, l’utilisation de l’Internet pour la recherche de définitions est de plus en plus importante. Wikipédia et Medline sont devenu les sites les plus consultés de la Web. Or, il existe un énorme nombre de définitions qui sont parfois inaccessibles aux utilisateurs. Celles-ci peuvent se trouver dans des sites non encyclopédiques ou dans de documents divers. Dans cette perspective nous avons développé le moteur de recherche Describe, qui permet de trouver des définitions en espagnol (Sierra et al., 2009). Une caractéristique de ce moteur est qu’il regroupe les résultats des recherches (définitions liées à un terme). Cet article présente la méthodologie de regroupement et l’évaluation des résultats. Ceux-ci sont encourageants du point de vue qualitatif. Par contre, l’évaluation quantitative pose des contraintes car il est compliqué d’évaluer la sémantique. Cet article est organisé comme suit : dans la section 2 nous introduisons les contextes définitoires (CD), dans la section 3 nous présentons des stratégies de regroupement des définitions. Le corpus utilisé dans nos expériences est présenté en section 4. Des évaluations avec des analyses quantitative et qualitative sont présentées au chapitre 5 avant de conclure et de donner quelques perspectives.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Nommage de sens à l’aide des vecteurs conceptuels Word Sense Naming with Conceptual Vectors

Dans le cadre de la recherche en sémantique lexicale, nous utilisons le modèle des vecteurs conceptuels pour représenter les aspects thématiques des mots. La base vectorielle est construite à partir de définitions provenant de différentes sources lexicales, ce qui permet statistiquement de tempérer les diverses incohérences locales. Pour désigner le sens obtenu après un regroupement des définit...

متن کامل

Étude de l'interaction entre variables pour l'extraction des règles d'influence

Résumé. Cet article présente une méthode efficace pour l’extraction de règles d’influence quantitatives positives et négatives. Ces règles d’influence introduisent une nouvelle sémantique qui vise à faciliter l’analyse d’un volume important de données. Cette sémantique fixe la direction de la règle entre deux variables en positionnant, au préalable, l’une comme étant l’influent et l’autre comme...

متن کامل

Une approche combinée pour l'enrichissement d'ontologie à partir de textes et de données du LOD

Résumé. Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles n...

متن کامل

A quoi servent les ontologies fondationnelles ?

Résumé : Ce texte se propose de discuter l’idée que les ontologies fondationnelles sont utiles, voire nécessaires, au bon fonctionnement des systèmes de traitement de contenus, en particulier à leur interopérabilité sémantique. Après un rappel des principales caractéristiques des ontologies, nous proposerons une liste des grandes fonctions aujourd’hui attribuées ou au moins attendues des OF, po...

متن کامل

Extraction and representation of support verb constructions in Spanish (Extraction et représentation des constructions à verbe support en espagnol) [in French]

Résumé. Le traitement informatique de constructions à verbe support (prendre une photo, faire une présentation) est une tâche difficile en TAL. Cela est également vrai en espagnol, où ces constructions sont fréquentes dans les textes, mais ne font pas souvent partie des lexiques exploitables par une machine. Notre objectif est d'extraire des constructions à verbe support à partir d’un très gran...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1501.04920  شماره 

صفحات  -

تاریخ انتشار 2010