Extraction et validation par croisement des relations d'une ontologie de domaine
نویسنده
چکیده
Face à de grandes quantités de documents web, notre objectif est d’extraire et de valider semi-automatiquement des relations d’un domaine. Dans l’état de l’art, l’extraction des relations a été faite soit par une approche statistique, une approche linguistique ou une approche hybride. De plus, l’intérêt a été toujours porté sur un voire deux types de relations. A contrario, notre objectif est d’extraire des relations de différents types en combinant des analyses de textes et en considérant les caractéristiques des mots. Dans cet article, nous avons défini un algorithme contextuel de découverte de relations qui combine différentes analyses (lexicale, syntaxique et statistique) pour définir des processus complémentaires qui assurent l’extraction de relations variées et pertinentes. Notre algorithme établit des opérations de croisements entre analyses afin de pouvoir valider certaines relations. Les relations valides, comme celles invalides, seront présentées à l’expert du domaine mais séparément.
منابع مشابه
Conception assistée d'une ontologie à partir d'une conceptualisation consensuelle exprimée de manière semi-formelle
Résumé : Cet article présente une méthodologie assistée de conception d'une ontologie à travers trois méthodes, soit une méthode d'élicitation des connaissances d'un domaine résultant en un modèle semi-formel de ces connaissances, une méthode de formalisation conduisant à la production d’une ontologie et une méthode de validation syntaxique et sémantique de l'ontologie. Les processus de formali...
متن کاملDétermination automatique des relations sémantiques entre les concepts d'une ontologie
RÉSUMÉ. Les systèmes d’information (SI) actuels sont de plus en plus complexes nécessitant un énorme travail de modélisation, utilisant une quantité énorme des données. Par conséquent, les concepteurs sont confrontés à un ensemble de problèmes liés à la méconnaissance du domaine à modéliser et à la difficulté de déterminer les concepts et leurs relations. Comme solution, nous proposons l’utilis...
متن کاملUne approche pour la validation du contenu d'une ontologie par un système à base de questions/réponses
Résumé : La construction d’ontologies est un processus itératif qui nécessite une étroite collaboration entre ingénieurs et experts du domaine. La complexité que peut proposer certains domaines comme la médecine combinée à celle des langages de description d’ontologies rendent cette collaboration difficile et génératrice d’erreurs. Dans nos travaux, nous proposons une approche pour la validatio...
متن کاملOntologies pour l'aide à l'exploration d'une collection de documents
Dans cet article nous présentons un système à base d'ontologies pour l'aide à une activité de recherche, d'analyse et d'exploration de corpus documentaires relatifs à un domaine scientifique. Les ontologies utilisées visent à représenter un domaine à la fois à travers le vocabulaire de ce domaine, mais également au travers de l'ensemble des méta-données qui peuvent être utiles dans des activité...
متن کاملReconnaissance automatique de concepts à partir d'une ontologie
Résumé Ce papier présente une approche qui s’appuie sur une ontologie pour reconnaître automatiquement des concepts spécifiques à un domaine dans un corpus en langue naturelle. La solution proposée est non-supervisée et peut s’appliquer à tout domaine pour lequel une ontologie a été déjà construite. Un corpus du domaine est utilisé dans lequel les concepts seront reconnus. Dans une première pha...
متن کامل