بهبود بازشناسی واجهای مصوت در گفتار پیوسته به کمک روش ترکیب gmm و svm
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
- نویسنده محمد نظری
- استاد راهنما ابوالقاسم صیادیان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1387
چکیده
زبان از اجزای بسیار زیادی تشکیل شده است که کوچکترین جزء یا واحد آن واج است. همه زبانهای بشری به واج تجزیه می شوند بنابراین در نخستین مرحله لازم است واجها با هم ترکیب شوند تا واحدهای بزرگتری مانند تکواژ و یا واژه ساخته شوند. از دیدگاه سیستمی در یک سیستم بازشناسی الگو پس از فرایندهای پیش پردازش نمونه های زمانی گفتار ویژگی های مناسب از نمونه های زمانی استخراج می شود. سپس بردار ویژگی های استخراج شده به مدلی عرضه می شود تا تطبیق آن با مدل بررسی شود. سپس بردار ویژگی های استخراج شده به مدلی عرضه می شود تا تطبیق آن با مدل بررسی شود. میزان این تطبیق و مقایسه با دیگر الگوها به عنوان معیار بازشناسی شناخته می شود. در این پایان نامه هدف ارایه روش جدیدی برای بهبود بازشناسی واجهای مصوت در گفتار پیوسته به کمک روشهای ترکیبی gmm و svm می باشد. در اینجا مساله بازشناسی واجهای مصوت در گفتار پیوسته مورد بررسی قرار می دهیم و از یک مدل آماری برای حل این مساله استفاده می کنیم و سپس به بهبود روشهای موجود می پردازیم.
منابع مشابه
بازشناسی گفتار پیوسته فارسی به کمک شبکه های عصبی
گفتار محصول سیستمهای تولید و درک گفتار و مغز انسان است . انسان همیشه از طریق گفت و شنود توانسته است ارتباط بهتری با محیط خود برقرار کند. بنابراین اگر بتوان از کامپیوتر بصورت سمعی و بصری بهره گرفت ، تحول بزرگی در استفاده از آنها بوجود می آید. در این پروژه، بمنظور طراحی روشهایی در بازشناخت گفتار پیوسته فارسی، شبکه های عصبی بعنوان ابزار مدلسازی انتخاب شده اند. در بخش نخست اجرای پروژه، با هدف دستیا...
15 صفحه اولروش های اتصال گرای جدید بر گرفته از سامانه ادراک گفتار انسان به منظور بهبود بازشناسی گفتار ماشینی
بازشناسی خودکار گفتار در شرایط عدم تطابق دادگان آموزش و آزمون، یکی از چالش های مهم در این مورد است. به منظور کاهش هر چه بیشتر این عدم تطابق، روش های مرسوم، سعی در بهسازی گفتار یا تطابق مدل آماری دارند. در این زمینه از جمله روش های دیگر می توان به آموزش مدل در شرایط مختلف اشاره کرد. موفقیت در این روش ها، در مقابل کارایی سیستم درک و بازشناسی در انسان بسیار ابتدایی به نظر می رسد...
متن کاملبهبود عملکرد سیستم بازشناسی گفتار پیوسته بوسیله ویژگیهای استخراج شده از مانیفولدهای گفتاری در فضای بازسازی شده فاز
The design for new feature extraction methods out of the speech signal and combination of their obtained information is one of the most effective approaches to improve the performance of automatic speech recognition (ASR) system. Recent researches have been shown that the speech signal contains nonlinear and chaotic properties, but the effects of these properties are not used in the continuous ...
متن کاملمعرفی شبکه های عصبی پیمانه ای عمیق با ساختار فضایی-زمانی دوگانه جهت بهبود بازشناسی گفتار پیوسته فارسی
In this article, growable deep modular neural networks for continuous speech recognition are introduced. These networks can be grown to implement the spatio-temporal information of the frame sequences at their input layer as well as their labels at the output layer at the same time. The trained neural network with such double spatio-temporal association structure can learn the phonetic sequence...
متن کاملمقاوم سازی سیستم بازشناسی گفتار پیوسته
دقت سیستم¬های بازشناسی گفتار در محیط¬های آزمایشگاهی و کنترل شده به میزان قابل قبولی افزایش یافته و امروزه شاهد استفاده از این سیستم¬ها در محیط¬های واقعی هستیم. با این حال، کارایی این سیستم¬ها در حضور نویز به دلیل عدم تطابق بین شرایط و محیط آموزشی و آزمون به شدت افت می¬کند. علاوه بر این، تنوع مشخصه¬های گفتاری گویندگان نیز بر کارایی این سیستم¬ها تاثیرگذار است. در سال¬های اخیر، عمده پژوهش¬های صورت...
بازشناسی احساس از روی گفتار پیوسته فارسی
در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023