Approche générique pour l'extraction de relations à partir de textes
نویسندگان
چکیده
Résumé : Cet article s’intéresse à l’extraction de relations dans le contexte du web sémantique, en vue de procéder à de la construction d’ontologies aussi bien qu’à de l’annotation automatique de documents. Notre approche permet l’extraction de relations entre entités à partir de textes. Elle ne fait pas d’hypothèse sur les entités, de manière à la rendre aussi générique que possible, et à autoriser par exemple l’extraction de relations entre concepts aussi bien que l’extraction de relations entre instances de concepts. Pour atteindre cet objectif, nous nous fondons sur l’algorithme LP. Afin d’adapter cet algorithme à l’extraction de relations, nous proposons une nouvelle notion de contexte reposant sur un graphe de dépendances, généré par un analyseur syntaxique. Un tel graphe de dépendances est bien adapté à la représentation de relations, puisqu’il permet, notamment, de repérer aisément les différents arguments d’un verbe dans une phrase. Nous présentons l’implémentation réalisée suivie d’une première phase d’expérimentations.
منابع مشابه
Exploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes
Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme ca...
متن کاملAcquisition de structures lexico-sémantiques à partir de textes : un nouveau cadre de travail fondé sur une structuration prétopologique
Résumé. Les structures lexico-sémantiques jouent un rôle essentiel dans les processus de fouille de textes. En codant les relations sémantiques entre concepts du discours elles apportent une connaissance stratégiques pour enrichir les capacités de raisonnement. Le développement de telles structures étant fortement limité du fait des efforts nécessaires à leur construction, nous proposons un nou...
متن کاملMise en lumière de relations sémantiques pour la construction d'ontologie à partir de textes
Résumé : La construction d’ontologies à partir de textes consiste à décrire des concepts par leurs relations conceptuelles et éventuellement leurs instances, à partir des matériaux textuels (termes, relations lexicales). Cet article propose une méthode pour mettre en lumière, par l’analyse de corpus, des relations lexicales susceptibles de donner naissance à des relations conceptuelles. Cette m...
متن کاملAnnotation de textes par extraction d'informations lexico-syntaxiques et acquisition de schémas conceptuels de causalité
Résumé. Nous présentons la méthode INSYSE (Interface Syntaxe SEmantique) pour l’annotation de documents textuels. Notre objectif est de construire des annotations sémantiques de ces résumés pour interroger le corpus sur la fonction des gènes et leurs relations de causalité avec certaines maladies. Notre approche est semi-automatique, centrée sur (1) l’extraction d’informations lexico-syntaxique...
متن کاملExtraction et exploitation des annotations contextuelles
Résumé Dans la perspective d’offrir un web sémantique, des travaux ont cherché à automatiser l’extraction des annotations sémantiques à partir de textes pour représenter au mieux la sémantique que vise à transmettre une page web. Dans cet article nous proposons une approche d’extraction des annotations qui représentent le plus précisément possible le contenu d’un document. Nous proposons de pre...
متن کامل