Multimodal Speech: from articulatory speech to audiovisual speech. (Parole Multimodale : de la parole articulatoire à la parole audiovisuelle)
نویسنده
چکیده
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Multimodal Speech: from articulatory speech to audiovisual speech Slim Ouni
منابع مشابه
BL-Database: A French audiovisual database for speech driven lip animation systems
The lack of publicly available annotated databases is a major limitation to research advances in speech processing. We describe in this paper an audiovisual speech database which is being made available to the research community. Our database, called BL-database (Blue Lips-database), consists of 238 utterances spoken by 17 speakers. The recordings have been performed during two sessions. The da...
متن کاملA Self-learning Speech Synthesis System
We describe a self-organising pseudo-articulatory speech production model (SPM), and present recent results when training the system on an X-ray mi-crobeam database. The SPM extracts statistics describing articulator positions and curvatures during the production of continuous speech, then applies an explicit co-articulation model to generate synthetic articulator trajectories corresponding to ...
متن کاملVers une inversion acoustico-articulatoire d'un locuteur étranger (Toward an acoustic to articulatory inversion of a foreign speaker) [in French]
L’inversion acoustico-articulatoire consiste à déterminer la forme du conduit bucal à partir d’un enregistrement audio de parole. Il s’agit plus précisément de reconstruire la trajectoire de divers points situés sur la langue, les lèvres et la machoire (et éventuellement le palais) à partir du signal acoustique. Intéressante en tant que telle pour l’étude des processus de production de la parol...
متن کاملDynamique temporelle du liage dans la fusion de la parole audiovisuelle (Temporal dynamics of binding in audiovisual speech fusion) [in French]
________________________________________________________________________________________________________ Temporal dynamics of binding in audiovisual speech fusion The McGurk effect demonstrates the phenomenon of audiovisual fusion: a sound "ba" mounted on a video "ga" is often perceived as "da". In a previous work we showed that audiovisual fusion might be modulated by a precedent binding proce...
متن کاملAssistance orale à la recherche visuelle - étude expérimentale de l'apport d'indications spatiales à la détection de cibles
La parole associée au geste, une forme courante d'expression multimodale destinée à l'utilisateur, a fait l'objet de nombreuses études ergonomiques. En revanche, rares sont les recherches publiées sur la conception et l'évaluation d'interfaces où les réactions du système combinent présentations graphiques et messages oraux. Cet article décrit une étude expérimentale visant à évaluer la contribu...
متن کامل