Une approche interactive de définition d'ontologies image An Interactive Approach For Image Ontology Definition
نویسندگان
چکیده
We propose an interactive approach for image processing application design. Within this approach, the user binds results from operator scripts to concepts of the scene model, instead of performing a "trial and error" process with the operators (one chooses an operator, sets its parameters and runs it, then evaluates Il est cependant possible de réaliser une application de manière incrémentale et interactive, sans passer par des systèmes aussi complexes, mais par essai d’opérateurs de TI, évaluation des résultats et correction si nécessaire. Cette démarche est justifiée lorsque le problème est simple, mais aussi lorsqu'on veut construire l'ontologie d'un domaine, avant de définir des applications proprement dites exploitant cette ontologie. On peut utiliser pour cela des environnements interactifs de TI dans lesquels l'utilisateur peut accéder aux opérateurs directement, les paramétrer interactivement puis provoquer leur exécution. De tels environnements permettent d'enregistrer l'enchaînement des opérateurs utilisés sous forme de scripts et permettent parfois d'introduire des structures de contrôle dans ces scripts (Khoros [16], Sage [7]). Leur utilisation suppose cependant que l'utilisateur soit suffisamment expert en TI pour savoir manipuler directement les opérateurs et leur paramétrage. 2.1 Formalisme pour les entités de TI Le formalisme présenté par Ph. Dejean [10] fournit une description orientée concepts et entités du TI, dans une perspective de planification de chaînes d'opérateurs [6] et de description d'objectifs de TI. Ce formalisme propose d'abord un modèle unifié des données de TI [8] en cinq champs (et quatre champs complémentaires) représentant l'information signal et ses transformées ainsi que l'information géométrique et ses structurations. Le Langage de Description de Données (LDD) permet de décrire les données avec leur structure. Il utilise les catégories syntaxiques du Langage de Description de Concepts (LDC) pour définir cinq catégories syntaxiques correspondant aux cinq champs du modèle de données. Sans chercher à automatiser ce processus de conception, nous proposons une autre forme de démarche qui permet à l’utilisateur de raisonner en termes d’entités du TI (pixels, points contours, régions...), d’effets de traitements, d’informations et de concepts (« zones claires », « région allongée traversant l'image », « pixels bleus regroupés en haut de l'image »...), plutôt qu’en termes de fonctionnalités ou d’opérateurs. Cette approche originale lui permet de rester dans son domaine d'application, notamment par la définition de concepts basés sur des entités. L'objectif est donc de mettre l'accent sur la mise en relation des effets des opérateurs (production, modification d'entités) avec des concepts du modèle de la scène, en permettant à l'utilisateur de spécifier par des interactions les indices visuels caractéristiques des concepts recherchés. C'est le système qui sélectionnera et qui exécutera les opérateurs correspondants. Ce modèle permet de décrire précisément les caractéristiques des données (en termes de transformations subies ou en termes de spécification de transformations à faire subir aux données). Les concepts décrivant les champs d'une donnée sont basés sur des propriétés, représentées par des couples [5]. Un concept est défini par un ensemble de propriétés, par une conjonction ou par une disjonction de concepts. Ces propriétés correspondent à des notions de l'utilisateur (position, forme, occupation spatiale, orientation, aspect) à propos des entités. Un concept a pour représentation une expression symbolique dans le langage LDC. Le modèle d'opérateurs associé a pour but de faire apparaître les transformations que la donnée subit. Il fournit de plus des informations sur les types d'entités admises en entrée et en sortie d'un opérateur. À partir de la représentation unifiée des données, un opérateur est représenté en indiquant comment cinq opérations (nomination, spécialisation, généralisation, structuration et déstructuration) sont réalisées sur les différents champs de la donnée et leur champs complémentaires. Un ensemble de fonctions de transformation élémentaires applicables sur ces champs a été défini à cet effet. Les transformations font intervenir des descripteurs pour expliciter la manière dont l'opérateur mesure et détermine une partition de la donnée lors du traitement. Nous décrivons dans cet article la manière dont l'utilisateur construit interactivement et de manière incrémentale les concepts en manipulant et en faisant produire par le système les entités qui les instancient (§3). Nous montrons comment le processus de définition des concepts se rapproche de la construction d'une ontologie du domaine d'application (§4). Chaque concept est associé à une expression symbolique ainsi qu'à une chaîne d'opérateurs qui en produit les instances. Enfin, nous donnons une analyse critique du système tel qu'il est défini et nous proposons de nouvelles perspectives pour l'étendre et l'enrichir (§5). Un opérateur peut alors être décrit et sélectionné selon les entités qu'il manipule ainsi que par les descripteurs explicitant les transformations qu'il réalise : c'est ainsi que le lien peut être fait avec les concepts dont les entités d'entrée et de sortie sont des instances. Lorsqu'une entité [15] a été produite ou modifiée par un opérateur, on lui attache une description explicitant comment les transformations élémentaires issues du modèle de l'opérateur ont modifié les champs de la donnée associée. Ainsi la représentation d'une entité rend compte à la fois de ce que contient l'entité et des actions effectuées pour l'obtenir. Nous exploitons ces informations dans notre système interactif pour proposer à l'utilisateur des moyens d'intervention pertinents sur les données et pour traduire, de manière transparente, ces interactions en termes de traitements. 2 État de l'art En ce qui concerne la conception interactive d'applications de TI, assez peu de travaux sont directement reliés à la formalisation des données, tant du point de vue de leur représentation que des transformations que ces données subissent. Pour ce qui est de la conception proprement dite d'applications, plusieurs pistes sont explorées. Parmi celles qui se sont orientées vers la conception interactive, nous ne considérerons ici que celles qui font appel à une manipulation directe des données plutôt que des opérateurs. Nous présentons dans la dernière partie les systèmes de production d'ontologies. 2.2 Conception d'applications de TI Ces travaux visent à la définition d'une "ontologie d'application" (vue comme la double spécialisation d’une ontologie du domaine et d’une ontologie de méthodes par KADS, [18]) propre aux documents vidéo : les concepts sont connectés par des relations de généralisation et de composition, ils représentent des notions comme un plan, une transition... Par contre, ils ne permettent pas de réaliser une ontologie du domaine pour les informations contenues dans ces documents, comme par exemple un présentateur de journal ou un ballon de football. V. Ficet a présenté une manière de construire interactivement un modèle conceptuel d'applications de TI [11]. Les différents niveaux d'abstraction des fonctionnalités du TI qui y sont modélisés donnent à l'utilisateur un moyen d'appréhender le TI à un niveau plus explicite et mieux adapté à ses compétences (lorsqu'il n'est pas un expert du TI). L'utilisateur construit ici un plan, en étant aidé par le système pour se diriger dans la hiérarchie des buts, mais il ne manipule pas directement des entités issues des données. 3 Construction interactive et incrémentale de concepts L'extension qui en est faite sous la forme d'une méthodologie de conception d'applications de TI (Athéna, [4]) propose des outils pour la construction et l'exploitation d'un ensemble structuré de tâches que l'on pourrait apparenter à une forme de construction d'une "ontologie de méthode" (au sens de KADS, [18]) propre au TI : il s'agit ici d'une description des stratégies d'utilisation de fonctionnalités d'opérateurs de TI, des méthodes d'utilisation de ces opérateurs, des mises en œuvre des opérateurs et finalement des relations que ces trois niveaux entretiennent. Cependant, dans ce système, les concepts du domaine ne sont toujours pas représentés explicitement. Un concept représente une notion visuelle pour l’utilisateur. Elle peut être liée ou non à des éléments du domaine des connaissances de l’utilisateur sur le contenu des images qu’il cherche à analyser. Le concept peut représenter une notion visuelle pertinente bien que sans rapport direct avec le contexte de l’application que l’utilisateur cherche à résoudre : par exemple, « objet clair », « objet allongé » ou « objet clair allongé qui traverse l'image ». Nous qualifions un tel concept de "générique". Dans le système SATI [2], l'accent est mis sur la formulation interactive d'objectifs de TI par la manipulation directe d'instances de résultats. L'exploitation des objectifs de TI formulés consiste à planifier une chaîne d'opérateurs qui réalise ces objectifs. Les objets manipulés sont décrits en tant qu'entités du TI. Ce travail met en lumière la structuration de ces entités. Il décrit également de façon partielle les manipulations et les interactions possibles sur ces entités, en évoquant certains descripteurs. Notre travail se situe dans la continuité de cette approche, mais il n'est pas associé comme dans [2] à un lourd module de planification rendant illusoire une réelle possibilité d'interaction. Un concept peut aussi être associé à une notion du domaine de compétence de l’utilisateur. Ceci peut être fait de deux manières : par renommage d’un concept générique reconnu par l’utilisateur en tant que concept de son domaine (« objet clair allongé qui traverse l'image » pourra être renommé par exemple dans une image de cartes électroniques en « fil traversant l'image », ou bien en « autoroute » dans une image aérienne), ou par construction à partir d’autres concepts étant eux-mêmes génériques ou du domaine de l’utilisateur (par exemple, le concept « lacs » est défini par spécialisation du concept générique « régions de texture ondulée » par adjonction d’une propriété de surface faisant référence au concept du domaine « mer »). 2.3 Outils pour la construction d'ontologies Dans notre système, les données manipulées sont présentées à l'utilisateur sous forme de groupes d'entités. Chaque groupe d'entités est l'instance d'un concept que l'utilisateur peut nommer et réutiliser. Un groupe d'entités est soit le résultat de l'extraction d'informations d'une donnée suite à la définition d'un concept par l'utilisateur (par exemple, une partition en régions de l'image suite à la définition du concept « objets définis par leur texture »), soit le résultat de la sélection de certaines entités dans un autre groupe d'entités, selon une propriété spécifiée par l'utilisateur (par exemple, le sousensemble des régions dont le degré de compacité est compris dans un certain intervalle). Dans notre interface, les concepts ne sont pas directement manipulables, sauf par le biais d'entités qui les instancient. Dans la suite de cet article, nous utiliserons le terme "concept" pour désigner indifféremment un concept ou le groupe d'entités associé, sauf mention contraire. Il existe de nombreux travaux sur des outils de construction d'ontologies se basant sur du texte, que ce soit d'un point de vue de la méthodologie de construction [14], ou du point de vue appliqué, dans des domaines aussi variés que les textes de loi [12] ou le domaine médical [19]. Dans le domaine de l'analyse d'images et des documents multimédia, des recherches sont en cours, en particulier sur les documents vidéo, pour modéliser leur structure [17]. L'objectif est de fournir des outils pour indexer de façon automatique un document en exploitant un modèle de sa structure. La définition de tels modèles de structure et les opérations de construction de documents vidéo reste cependant manuelle, dans la mesure où il n’existe pas d’outil pour manipuler et associer les concepts du modèle dans la phase de définition de celui-ci.
منابع مشابه
ROMIE, une approche d'alignement d'ontologies à base d'instances. (ROMIE, Resource based Ontology Mapping within an Interactive and Extensible environment)
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملEnrichissement d'ontologies grâce à l'annotation sémantique de pages web
Résumé. Nous présentons une approche pour enrichir automatiquement une ontologie à partir d’un ensemble de pages web structurées. Cette approche s’appuie sur un noyau d’ontologie initial. Son originalité est d’exploiter conjointement la structure des documents et des annotations sémantiques produites à l’aide du noyau d’ontologie pour identifier de nouveaux concepts et des spécialisations de re...
متن کاملApproche formelle de fusion d'ontologies à l'aide des grammaires de graphes typés
Résumé. L’article propose une approche formelle de fusion d’ontologies se reposant sur les grammaires de graphes typés. Elle se décompose en trois étapes : 1) la recherche de similarités entre concepts ; 2) la fusion des ontologies par l’approche algébrique SPO (Simple Push Out) ; 3) l’adaptation d’une ontologie globale par le biais de règles de réécriture de graphes. Contrairement aux solution...
متن کاملUn algorithme multi-agent de classification pour la construction d'ontologies dynamiques
Résumé. La construction d’ontologies à partir de textes reste une tâche coûteuse en temps qui justifie l’émergence de l’Ontology Learning. Notre système, Dynamo, s’inscrit dans cette mouvance, en apportant une approche originale basée sur une architecture multi-agent adaptative. En particulier, l’article présente le cœur de notre approche, un algorithme distribué de classification hiérarchique ...
متن کاملDynamic Triangulation of Implicit Surfaces: towards the handling of topology changes
In this paper, we introduce a new approach to mesh an animated implicit surface for rendering purposes. This approach is based on a double triangulation of the surface. In the first triangulation, the vertices are the nodes of a finite element model. The aim of this model is to uniformly and dynamically sample the surface. It is robust, efficient and prevents the inversion of triangles. The sec...
متن کامل