Comparaison du modèle vectoriel et de la pondération tf*idf associée avec une méthode de propagation d'activation

نویسنده

  • Christophe Brouard
چکیده

RÉSUMÉ. L'objet de ce papier est de montrer qu'il est possible de mettre le modèle vectoriel et la pondération tf*idf associée en correspondance avec le calcul d'une résonance dans un réseau associatif basé sur une méthode très simple de propagation d'activation. Nous décrivons un réseau associatif associant termes et documents puis un calcul de résonance entre une requête et un document dans ce réseau. La pondération tf*idf apparaît naturellement dans le calcul et nous expliquons comment chacun des facteurs s'interprète dans la propagation d'activation. Nous montrons que ce calcul, comme le cosinus, correspond au produit de l'évaluation de la spécificité et de l'exhaustivité du document vis-àvis de la requête. La comparaison expérimentale réalisée sur les corpus CLEF3 et TREC3 révèle que, si l'on choisit adéquatement les fonctions qui régissent l'activation et la propagation d'activation, la méthode basée sur la résonance obtient des performances similaires à celles du modèle Okapi-BM25.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Prédiction structurée pour l'analyse syntaxique en constituants par transitions : modèles denses et modèles creux

RÉSUMÉ. L’article présente une méthode d’analyse syntaxique en constituants par transitions qui se fonde sur une méthode de pondération des analyses par apprentissage profond. Celle-ci est comparée à une méthode de pondération par perceptron structuré, vue comme plus classique. Nous introduisons tout d’abord un analyseur syntaxique pondéré par un réseau de neurones local et glouton qui s’appuie...

متن کامل

Congenital Absence of Renal Artery: Introducing Two Patients

Les auteurs font une revue de la litterature a propos de deux cas de l'agenesie de l'artere renale, anomalie rare, dont les circonstances de decouverte varient selon les cas: infections recidiventes des voies urinaires, anomalie du Perinee, hypertension arterielle.  La premiere observation concerne une fillette a.gee de 7 ans, hospitalisee pour une insuffi­sance cardiaque severe avec hypertens...

متن کامل

Semantic Clustering using Bag-of-Bag-of-Features

RÉSUMÉ. Le calcul de distances entre représentations textuelles est au cœur de nombreuses applications du Traitement Automatique des Langues. Les approches standard initiallement développées pour la recherche d’information sont alors le plus souvent utilisées. Dans la plupart des cas, il est donc adopté une description sac-de-mots (ou sac-d’attributs) avec des pondérations de type TF-IDF ou des...

متن کامل

A review of weighting schemes for bag of visual words image retrieval

Current studies on content-based image retrieval mainly rely on bags of visual words. This model of image description allows to perform image retieval in the same way as text retrieval: documents are described as vectors of (visual) word frequencies, and documents are match by computing a distance or similarity measure between the vectors. But instead of raw frequencies, documents can also be d...

متن کامل

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013