Semantic Annotation and Terminology Validation in full scientific articles in Social Sciences and Humanities (Annotation sémantique et validation terminologique en texte intégral en SHS) [in French]
نویسندگان
چکیده
Our work is in the field of the validation of term candidates occurrences in context. The textual data used in this article comes from the freely available corpus SCIENTEXT. The term candidates are computed by the platform TTC-TermSuite and their occurrences are projected in the texts. The main issue of this article is to examine how contexts are able to provide relevant linguistic criteria to validate or reject each occurrence of term candidates according to the distinction between a terminological and a non terminological use (general language, transdisciplinary use, use coming from another science). To answer this question, we compare two methods (a textometric one and another inspired from Lesk) with the manual annotation of the same corpus and we evaluate if a semantic annotation of contexts improves the accuracy of the choices made automatically. Mots-clés : Annotation sémantique extraction et désambiguïsation terminologique textométrie texte intégral
منابع مشابه
Annotation sémantique du French Treebank à l'aide de la réécriture modulaire de graphes (Semantic Annotation of the French Treebank using Modular Graph Rewriting) [in French]
RÉSUMÉ Nous proposons d’annoter le French Treebank à l’aide de dépendances sémantiques dans le cadre de la DMRS en partant d’une annotation en dépendances syntaxiques de surface et en utilisant la réécriture modulaire de graphes. L’article présente un certain nombre d’avancées concernant le calcul de réécriture utilisé : l’utilisation de règles pour faire le lien avec des lexiques, en particuli...
متن کاملHelp enrich a terminological repository : proposals and experiments (Aide à l'enrichissement d'un référentiel terminologique : propositions et expérimentations) [in French]
RÉSUMÉ En s’appuyant sur une expérience d’enrichissement terminologique, cet article montre comment assister le travail d’acquisition terminologique et surmonter concrètement les deux difficultés qu’il présente : la masse de candidats-termes à considérer et la subjectivité des jugements terminologiques qui varient notamment en fonction du type de terminologie à produire. Nous proposons des stra...
متن کاملOntologies étendues pour l'annotation sémantique
Résumé : Cet article tente de formaliser le processus consistant à annoter sémantiquement un texte au regard d’une ontologie. L’annotation sémantique met des fragments de texte en correspondance avec les éléments d’une ontologie, mais toute la difficulté consiste à identifier les fragments à annoter et les étiquettes à leur associer. Nous proposons d’étendre les ontologies par des règles d’anno...
متن کاملDu texte à la connaissance : annotation sémantique et peuplement d'ontologie appliqués à des artefacts logiciels
Résumé : Les applications logicielles possèdent généralement une courbe d'apprentissage considérable pour les nouveaux développeurs et pour ceux qui souhaitent en intégrer des parties dans leurs propres applications. L'attrait d'utiliser ici une technologie à base de sémantique repose sur son potentiel à associer un réseau de connaissance aux artefacts logiciels existants, structurés ou non. Ce...
متن کاملTranslation of English Text to a DRS-based, Sign Language Oriented Semantic Representation
Une vue d’ensemble de l’architecture de la partie linguistique d’un système de traduction de texte Anglais en langage de signes est présentée. Nous nous concentrons sur la traduction du texte en langue naturelle vers une représentation sémantique pour l’aide à la traduction gestuelle. Nous rapportons nos progrès actuels dans l’application de techniques syntaxiques, sémantiques et contextuelles ...
متن کامل