نام پژوهشگر: نغمه مرادی لاکه

بازشناسی مقاوم گفتاردربرابرنویزبااستفاده ازترکیب فیلترکردن های زمانی وهنجارسازی ویژگی های گفتاری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه گیلان - دانشکده فنی و مهندسی 1389
  نغمه مرادی لاکه   بابک ناصرشریف

یک سیستم بازشناس گفتار باید بتواند یک سیگنال گفتار بیان شده را مستقل ازگوینده، ابزار انتقال و محیط بیان گفتار به یک پیغام متنی تبدیل کند. یکی ازچالش های موجود در بازشناسی گفتار استفاده از سیستمهای بازشناس گفتار در محیط های واقعی است که در آنها نویز یا اثرات کانال همواره وجود دارد. این عوامل خصوصیات آماری سیگنال گفتار و ویژگی های آن را تغییرمی دهد به طوری که مدل آموزش یافته ای که ازروی گفتاربدون نویز بدست می آید نمی تواند بیانگرخصوصیات آماری داده های نویزی نیز باشد. این عدم تطابق بین محیط های آموزش وآزمایش دقت بازشناسی را شدیداًتحت تأثیرخودقرارمی دهد. برای مقابله با تاثیر نویز بر سیگنال گفتار سه روش کلی وجود دارد: بهبودگفتار، جبران ویژگی و تطبیق مدل. روشهای بهبود گفتار نویز را در سطح سیگنال گفتار کاهش می دهند و بر روی ویژگیها یا مدلهای آماری گفتار تغییری صورت نمی دهند. روشهای جبران ویژگی کاهش نویز را در مرحله استخراج ویژگی یا پس از پایان آن با انجام پس پردازش انجام می دهند. روشهای تطبیق مدل نیز با تبدیل و تغییر پارامترهای مدل آماری گفتار، مدل را با ویژگیهای نویزی گفتار تطبیق می دهند. دراین پایان نامه دو روش با استفاده ازترکیب روش های بهبود گفتار و روشهای جبران ویژگی پیشنهاد گردیده است. در روش پیشنهادی اول ابتدا ازیک فیلتر اصلاح شده مبتنی بر تفاضل طیف موسوم به خطای مربعات کمینه (mmse) برای کاهش نویز در سطح سیگنال استفاده می شود. سپس برای جبران تاثیر اعوجاجات ایجاد شده در سطح سیگنال گفتار و در نتیجه ویژگیهای استخراجی آن، یک فیلتر موقت مبتنی بر داده، بر دنباله ویژگیها اعمال می شود. در روش پیشنهادی دوم ، پس از معرفی و انجام یک پردازش وابسته به نسبت سیگنال به نویز بر روی ویژگیهای مل کپستروم، از فیلتر کردن موقت مبتنی بر داده ویژگیها استفاده می شود. این روشها بر روی دادگان aurora 2 ، مورد ارزیابی و آزمایش قرار گرفته اند. نتایج نشان می دهد که روشهای ترکیبی پیشنهادی درصد بازشناسی بهتری از دیگر روشها دارند. علاوه بر اینکه فیلترهای مبتنی بر داده در کاربرد بازشناسی موفق تر از فیلترهای ثابت هستند. با استفاده از این روشها درصد دقت بازشناسی نسبت به سیستم پایه ( ضرایب مل کپستروم) بطور متوسط در حدود 17% افزایش یافته است.