ORTOLANG an infrastructure for sharing of written and speech language resources (ORTOLANG : une infrastructure de mutualisation de ressources linguistiques écrites et orales) [in French]
نویسنده
چکیده
Résumé. Nous proposons une démonstration de la Plateforme de l’Equipex ORTOLANG (Open Resources and Tools for LANGuage : www.ortolang.fr) en cours de mise en place dans le cadre du programme d’investissements d’avenir (PIA) lancé par le gouvernement français. S’appuyant entre autres sur l’existant des centres de ressources CNRTL (Centre National de Ressources Textuelles et Lexicales : www.cnrtl.fr) et SLDR (Speech and Language Data Repository : http://sldr.org/), cette infrastructure a pour objectif d’assurer la gestion, la mutualisation, la diffusion et la pérennisation de ressources linguistiques de type corpus, dictionnaires, lexiques et outils de traitement de la langue, avec une focalisation particulière sur le français et les langues de France.
منابع مشابه
Speech Modeling for Facilitating Oral-Based Communication
The project aims to design a real-time control system for wind farms that will maximize energy production while limiting sound nuisance. This will leverage our know-how on audio source separation and uncertainty modeling and propagation. 8. Partnerships and Cooperations 8.1. National Initiatives 8.1.1. Equipex ORTOLANG Project acronym: ORTOLANG 6 Project title: Open Resources and TOols for LANG...
متن کاملFormalisation de l'amazighe standard avec NooJ (Formalization of the standard Amazigh with NooJ) [in French]
Dans cette perspective, et dans le but de développer des outils et des ressources linguistiques, nous avons entrepris de construire un module NooJ pour la langue amazighe standard (Ameur et al., 2004). Le présent article propose une formalisation de la catégorie nom permettant de générer à partir d’une entrée lexicale son genre (masculin, féminin), son nombre (singulier, pluriel), et son état (...
متن کاملDe l'arabe standard vers l'arabe dialectal : projection de corpus et ressources linguistiques en vue du traitement automatique de l'oral dans les médias tunisiens
In this work, we focus on the problems of the automatic treatment of oral spoken in the Tunisian media. This oral is marked by the use of code-switching between the Modern Standard Arabic (MSA) and the Tunisian dialect (TD). Our goal is to build useful resources to learn language models that can be used in automatic speech recognition applications. As it is a variant of MSA, we describe in this...
متن کاملFusion de ressources hétérogènes pour la recherche d'information multilingue
RÉSUMÉ. Afin d’améliorer la recherche multilingue dans le moteur de recherche Sinequa Engine, nous avons intégré les connaissances multilingues du service Sensagent au module de requêtes du moteur de recherche Sinequa Engine. L’interface développée propose une extension de la requête aux choix de l’utilisateur par traduction des différents mots dans les langues sélectionnées. Pour limiter le gr...
متن کاملTowards a Linguistic Linked Open Data cloud: The Open Linguistics Working Group
The Open Linguistics Working Group (OWLG) is an initiative of experts from different fields concerned with linguistic data, including academic linguistics (e.g. typology, corpus linguistics), applied linguistics (e.g. computational linguistics, lexicography and language documentation), and NLP (e.g. from the Semantic Web community). The primary goals of the working group are 1) promoting the id...
متن کامل