Regrouper les données textuelles et nommer les groupes à l'aide de classes recouvrantes

نویسندگان

  • Marian-Andrei Rizoiu
  • Julien Velcin
  • Jean-Hugues Chauchat
چکیده

Résumé. Organiser les données textuelles et en tirer du sens est un défi majeur aujourd’hui. Ainsi, lorsque l’on souhaite analyser un débat en ligne ou un forum de discussion, on voudrait pouvoir rapidement voir quels sont les principaux thèmes abordés et la manière dont la discussion se structure autour d’eux. Pour cela, et parce que un même texte peut être associé à plusieurs thèmes, nous proposons une méthode originale pour regrouper les données textuelles en autorisant les chevauchements et pour nommer chaque groupe de manière lisible. La contribution principale de cet article est une méthode globale qui permet de réaliser toute la chaîne, partant des données textuelles brutes jusqu’à la caractérisation des groupes à un niveau sémantique qui dépasse le simple ensemble de mots.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Portail Web de Veille Stratégique pour Mobile

Les techniques d’analyse multidimensionnelle sont actuellement bien maîtrisées pour toutes les données quantitatives disponibles sur les systèmes d’information des entreprises ou des administrations à condition que le SGBD s’y prête, que le schéma de la base soit adapté et que les données soient de qualité (homogènes, à jour, complètes, granularisées, compatibles,...). Il est toujours possible ...

متن کامل

Indexation et intégration de ressources textuelles à l'aide d'ontologies : application au domaine biomédical

Résumé : De nombreuses découvertes scientifiques sont contraintes aujourd’hui par la difficile intégration des données misent à disposition dans différentes ressources. L’utilisation d’ontologies pour indexer et intégrer les ressources de données est un moyen de valoriser la connaissance d’un domaine en facilitant la recherche et la fouille de données. Dans cet article nous présentons un mécani...

متن کامل

Passage aux noyaux en classification recouvrante

Résumé. La classification recouvrante correspond à un domaine d’étude très actif ces dernières années et dont l’objectif est d’organiser un ensemble de données en groupes d’individus similaires avec la particularité d’autoriser des chevauchements entre les groupes. Parmi les approches étudiées nous nous intéressons aux extensions recouvrantes des modèles de type moindres carrés et constatons le...

متن کامل

OSOM : un algorithme de construction de cartes topologiques recouvrantes

Résumé. Les modèles de classification recouvrante ont montré leur capacité à générer une organisation plus fidèle aux données tout en conservant la simplification attendue par une structuration en classes strictes. Par ailleurs les modèles neuronaux non-supervisés sont plébiscités lorsqu’il s’agit de visualiser la structure de classes. Nous proposons dans cette étude d’étendre les cartes auto-o...

متن کامل

Une mesure de proximité et une méthode de regroupement pour l'aide à l'acquisition d'ontologies spécialisées

Résumé. Cet article traite du regroupement d’unités textuelles dans une perspective d’aide à l’élaboration d’ontologies spécialisées. Le travail présenté s’inscrit dans le cadre du projet BIOTIM. Nous nous concentrons ici sur l’une des étapes de construction semi-automatique d’une ontologie qui consiste à structurer un ensemble d’unités textuelles caractéristiques en classes susceptibles de rep...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010