Mutualiser et partager, un défi pour la génomique fonctionnelle végétale. (Data integration challenges for plant functional genomics)
نویسنده
چکیده
In this document, we present research topic developed in the context of heteroge-neous data integration in plant functional genomic. Plant functional genomic is a biologicalframework where several disciplines and techniques take part in the discover of genes function.It generates a large quantity of data which the scientists manage in various ways. However,many data sources, complementary or overlapping, are necessary to enrich information aboutgenes function. The problem comes from the distribution, the autonomy and the heterogeneityof these sources. That drags biologists seeking information, to integrate results manually.The objective of this thesis is to make easier the scientists searches and to reach in a transpa-rent way information resulting from several data sources. For that, we propose two approachesin order to evaluate the advantages and the disadvantages of them. Firstly we propose the inte-gration of sources through the adaptation of a mediation system : Select. Successor of DISCO,Le Select allows the integration of heterogeneous and distributed data sources through a rela-tionnal integration model. Secondly, we propose the creation of a user personalized environ-ment that integrate data sources through workflows of Web services. This system is based onBioMOBY system and its Central Registry. To conclude, we propose a methodology adapted tothe needs for similar integration projects.
منابع مشابه
Equilibrage de Charge pour les Grilles de Calcul: Classe des Tâches Dépendantes et Indépendantes
Résumé. L’équilibrage de charge dans les grilles de calcul représente un défi pour les chercheurs et les développeurs de ces types de systèmes. Ce défi est en rapport avec les particularités de ces infrastructures, à savoir, l’hétérogénéité, la dynamicité et le passage à l’échelle. Ce challenge devient beaucoup plus complexe quand il s’agit d’équilibrer la charge d’un système traitant des tâche...
متن کاملRegrouper les données textuelles et nommer les groupes à l'aide de classes recouvrantes
Résumé. Organiser les données textuelles et en tirer du sens est un défi majeur aujourd’hui. Ainsi, lorsque l’on souhaite analyser un débat en ligne ou un forum de discussion, on voudrait pouvoir rapidement voir quels sont les principaux thèmes abordés et la manière dont la discussion se structure autour d’eux. Pour cela, et parce que un même texte peut être associé à plusieurs thèmes, nous pro...
متن کاملMedian clouds and a fast transposition median solver
The median problem seeks a permutation whose total distance to a given set of permutations (the base set) is minimal. This is an important problem in comparative genomics and has been studied for several distance measures such as reversals. The transposition distance is less relevant biologically, but it has been shown that it behaves similarly to the most important biological distances, and ca...
متن کاملFouille de données dans les systèmes Pair-à-Pair pour améliorer la recherche de ressources
Résumé. La quantité de sources d’information disponible sur Internet fait des systèmes d’échanges pair-à-pair (P2P) un genre nouveau d’architecture qui offre à une large communauté des applications pour partager des fichiers, des calculs, dialoguer ou communiquer en temps réel. Dans cet article, nous proposons une nouvelle approche pour améliorer la localisation d’une ressource sur un réseau P2...
متن کاملAdaptation d'un algorithme génétique pour la reconstruction de réseaux de régulation génétique : COGARE
RÉSUMÉ. Nous proposons une approche “algorithme génétique” pour la reconstruction génomique. Notre approche introduit le concept d’algorithmie génétique multi-échelle : l’optimisation est conduite simultanément à une échelle locale et à une échelle globale. La fonction d’efficacité est donc hybride. Notre approche prend également en compte plusieurs types de données, dynamiques, statiques, ou i...
متن کامل