Modélisation de relations dans l'approche modèle de langue en recherche d'information
نویسندگان
چکیده
RÉSUMÉ. Nous abordons dans cet article le problème de la prise en compte de relations (par exemple de nature syntaxique ou sémantique) dans un modèle de langues en recherche d’information. En particulier, nous proposons, sur la base du modèle de langue, un cadre complet pour la prise en compte de relations, étiquetées ou non. Afin d’illustrer ce cadre, nous avons conduit une série d’expériences fondées sur différentes indexations structurées (grammaire de dépendances et graphes de relations entre concepts) dans le domaine médical. Nos résultats montrent que l’intégration d’information sur les relations entre termes améliore la qualité d’un système de recherche d’information sur la précision à 5 documents. Ils confirment aussi le bien-fondé du modèle que nous proposons.
منابع مشابه
Classification conceptuelle d'une collection documentaire - Intertextualité et Recherche d'Information
RÉSUMÉ. Une collection documentaire est généralement représentée comme un ensemble de documents mais cette modélisation ne permet pas de rendre compte des relations intertextuelles et du contexte d’interprétation d’un document. Le modèle documentaire classique trouve ses limites dans les domaines spécialisés où les besoins d’accès à l’information correspondent à des usages spécifiques et où les...
متن کاملExpansion de requêtes pour la recherche d'information multilingue
1. Recherche d'information multilingue : approche par traduction des contenus La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues dans lesquelles ces contenus sont disponibles. En revanche, la complexité des requêtes reste limitée (2 à 3 mots en moyenne). Des traitements spécifiques s'avèrent donc nécessaires pour préciser le sens de certaines requêtes, ou a...
متن کاملRecherche d'information dans MEDLINE
RÉSUMÉ. Cet article décrit la banque documentaire MEDLINE depuis laquelle une collection test comprenant environ 4,5 million de documents structurés a été construite à partir des campagnes d’évaluation TREC. Dans une deuxième partie, nous évaluons et comparons l’efficacité du dépistage de l’information de dix modèles (probabiliste, modèle de langue, approches vectorielles). Cette évaluation est...
متن کاملUn modèle de rôles multi-politiques d'accès pour la coopération en sécurité de systèmes d'information
RÉSUMÉ. Ce travail de recherche s'inscrit dans le domaine de la sécurité des accès dans les systèmes d'information coopérant. La modélisation proposée doit prendre en compte l'interopération de systèmes d'information ouverts et évolutifs et, de plus, garantir le respect des différentes politiques de sécurité locales. La coexistence de sources d’information hétérogènes dans le cadre d’un système...
متن کاملModèles d'information pour la recherche multilingue
RÉSUMÉ. Nous présentons dans cet article plusieurs extensions multilingues des modèles d’information, en particulier le modèle log-logistique (LL) et le modèle Smoothed Power Law (SPL), récemment introduits en recherche d’information (Clinchant et al., 2010). Ces extensions sont fondées sur (a) une généralisation de la notion d’information utilisée dans ces modèles, (b) une généralisation des v...
متن کامل