Détection de changements dans des flots de données qualitatives
نویسندگان
چکیده
Résumé. Pour mieux analyser et extraire de la connaissance de flots de données, des approches spécifiques ont été proposées ces dernières années. L’un des challenges auquel elles doivent faire face est la détection de changement dans les données. Alors que de plus en plus de données qualitatives sont générées, peu de travaux de recherche se sont intéressés à la détection de changement dans ce contexte et les travaux existants se sont principalement focalisés sur la qualité d’un modèle appris plutôt qu’au réel changement dans les données. Dans cet article nous proposons une nouvelle méthode de détection de changement non supervisée, appelée CDCStream (Change Detection in Categorical Data Streams), adaptée aux flux de données qualitatives.
منابع مشابه
Détection de changements de distribution dans un flux de données : une approche supervisée
Résumé. L’analyse de flux de données traite des données massives grâce à des algorithmes en ligne qui évitent le stockage exhaustif des données. La détection de changements dans la distribution d’un flux est une question importante dont les applications potentielles sont nombreuses. Dans cet article, la détection de changement est transposée en un problème d’apprentissage supervisé. Nous avons ...
متن کاملDétection et Représentation des changements dans les sources de données RDF
Résumé : De nombreuses sources de données RDF sont en évolution constante que ce soit au niveau des données ou du vocabulaire utilisé (ontologie). De nombreuses tâches d’intégration sont impactées par ces modifications qu’il s’agisse de synchroniser des données locales avec une source de données externe ou d’effectuer des traitements plus complexes comme le liage ou la fusion de données. Dans c...
متن کاملInvestigation visuelle d'événements dans un grand flot de liens
Résumé. Nous présentons une nouvelle méthode d’analyse exploratoire de grands flots de liens que nous appliquons à la détection d’événements significatifs dans plus de 2 millions d’interactions (pendant 4 mois) entre utilisateurs du réseau social en ligne Github. Nous combinons une méthode statistique de détection automatique d’événements dans une série temporelle, Outskewer, avec un système de...
متن کاملApprentissage d'ensemble d'opérateurs de projection orthogonale pour la détection de nouveauté
Résumé. Dans ce papier, nous proposons une approche de détection de nouveauté fondée sur les opérateurs de projection orthogonale et l’idée de double bootstrap (bibootstrap). Notre approche appelée Random Subspace Novelty Detection Filter (RS-NDF), combine une technique de rééchantillonnage et l’idée d’apprentissage d’ensemble. RS-NDF est un ensemble de filtres NDF (Novelty Detection Filter), i...
متن کاملDetection of change in river flow using phase randomization
Detection of nonstationarity in series of flow records is of vast scientific and practical significance. In order to develop guidance as to the choice of an appropriate test, among the many candidates, one has recourse to analysis of a controlled trend artificially introduced to generated data mimicking river flow observations. Raw series of good quality flow data were normalized and de-seasona...
متن کامل