مهدی رشیدی نژاد بشر ابادی

نام پژوهشگر: مهدی رشیدی نژاد بشر ابادی

پاکسازی توأم نویز و پژواک از روی سیگنال گفتار با فرض مدل آماری لاپلاسین

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
مهدی رشیدی نژاد بشر ابادی حمید رضا ابوطالبی

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته است که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. بنابراین لازم است که در محیط های نویزی و دارای پژواک نیز عملکرد مناسب و دقیق تری برای این سیستم ها داشته باشیم. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین گر دامنه طیف سیگنال گفتار مبتنی بر معیار mmse با فرض گوسی بودن ضرائب dft سیگنال گفتار، ارائه شده اند. در سال های اخیر محققان به دنبال وارد کردن مدل های احتمالاتی دقیق تری برای ضرائب dft سیگنال گفتار هستند. در این پایان نامه، ابتدا به بررسی سیستم های تک -کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن ضرائب dft سیگنال گفتار می پردازیم. سپس تخمین گر ارائه شده مبتنی بر فرض توزیع لاپلاسین (lapmmse) و تقریب ارائه شده از آن (با نام aplapmmse) مورد بررسی و مطالعه قرار می دهیم. در ادامه، با توجه به پیچیده، غیرخطی و برای پیاده سازی زمانبر بودن این تقریب، با استفاده از تقریب های مناسب دیگری برای تابع بسل و برای تابع چگالی احتمال مشترک، این روش را بهبود داده و تخمین گر جدید impaplapmmse را ارائه می دهیم. در ادامه این پایان نامه، روش تخمین مرتبه متغیر mmse (?-order mmse) و نیز تخمین گرammse را نیز با فرض لاپلاسین بودن ضرائب dft مورد بازنگری قرار داده و تخمین گرهای جدید در هر مورد استخراج می کنیم. در انتها، به بررسی و تعمیم روش های تخمین دامنه طیف سیگنال گفتار به منظور کاهش نویز و پژواک از روی سیگنال گفتار و تأثیر وارد کردن مدل آماری سیگنال گفتار بر روی عملکرد این روش ها می پردازیم. در این راستا روش های پیشنهادی ?-order aplapmmse و alapmmse را برای کاهش پژواک تعمیم می دهیم. با مقایسه روش های پیشنهادی (?-order aplapmmse و alapmmse) با روش های om-lsa و ammse، تأثیر وارد کردن مدل آماری سیگنال گفتار برای کاهش پژواک را ارزیابی می کنیم. نتایج نشان می دهند با وارد کردن مدل آماری سیگنال گفتار کارآیی این تخمین گرها هنگامی که سیگنال گفتار به طور همزمان دارای نویز و پژواک است، بهتر است

۱۵ صفحه ی اول