Multimodal Speech: from articulatory speech to audiovisual speech. (Parole Multimodale : de la parole articulatoire à la parole audiovisuelle)

نویسنده

  • Slim Ouni
چکیده

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Multimodal Speech: from articulatory speech to audiovisual speech Slim Ouni

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

BL-Database: A French audiovisual database for speech driven lip animation systems

The lack of publicly available annotated databases is a major limitation to research advances in speech processing. We describe in this paper an audiovisual speech database which is being made available to the research community. Our database, called BL-database (Blue Lips-database), consists of 238 utterances spoken by 17 speakers. The recordings have been performed during two sessions. The da...

متن کامل

A Self-learning Speech Synthesis System

We describe a self-organising pseudo-articulatory speech production model (SPM), and present recent results when training the system on an X-ray mi-crobeam database. The SPM extracts statistics describing articulator positions and curvatures during the production of continuous speech, then applies an explicit co-articulation model to generate synthetic articulator trajectories corresponding to ...

متن کامل

Vers une inversion acoustico-articulatoire d'un locuteur étranger (Toward an acoustic to articulatory inversion of a foreign speaker) [in French]

L’inversion acoustico-articulatoire consiste à déterminer la forme du conduit bucal à partir d’un enregistrement audio de parole. Il s’agit plus précisément de reconstruire la trajectoire de divers points situés sur la langue, les lèvres et la machoire (et éventuellement le palais) à partir du signal acoustique. Intéressante en tant que telle pour l’étude des processus de production de la parol...

متن کامل

Dynamique temporelle du liage dans la fusion de la parole audiovisuelle (Temporal dynamics of binding in audiovisual speech fusion) [in French]

________________________________________________________________________________________________________ Temporal dynamics of binding in audiovisual speech fusion The McGurk effect demonstrates the phenomenon of audiovisual fusion: a sound "ba" mounted on a video "ga" is often perceived as "da". In a previous work we showed that audiovisual fusion might be modulated by a precedent binding proce...

متن کامل

Assistance orale à la recherche visuelle - étude expérimentale de l'apport d'indications spatiales à la détection de cibles

La parole associée au geste, une forme courante d'expression multimodale destinée à l'utilisateur, a fait l'objet de nombreuses études ergonomiques. En revanche, rares sont les recherches publiées sur la conception et l'évaluation d'interfaces où les réactions du système combinent présentations graphiques et messages oraux. Cet article décrit une étude expérimentale visant à évaluer la contribu...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013