سیدایمان موسویان قهفرخی

نام پژوهشگر: سیدایمان موسویان قهفرخی

بازشناسی مقاوم گوینده بر اساس مدل gmm-ubm

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد 1390
سیدایمان موسویان قهفرخی منصور ولی

بازشناسی گوینده به شناسایی فرد از روی سیگنال گفتار گفته می شود. در یک سیستم بازشناسی گوینده دو بخش اصلی مطرح است، بخش اول استخراج بردارهای بازنمایی مناسب و بخش دوم استفاده از یک مدل خوب که بتواند به بهترین نحو نشان دهنده گوینده متناظر با خودش باشد، که در زمینه شناسایی گوینده بردارهای بازنمایی mfcc و مدل gmm بسیار مرسوم و مورد توجه هستند. موضوع بسیار مهمی که در سال های اخیر مورد توجه محققان قرارگرفته است بحث مقاوم بودن یک سیستم بازشناسی گوینده و عملکرد خوب در محیط طبیعی می باشد. در یک سیستم بازشناسی با مدل gmm، نواحی همپوشانی گوسین ها مربوط به بردارهای بازنمایی مشترک بین افراد مختلف است، که خطای قابل ملاحظه ای را ایجاد می کند. در سال 2007 آقای سانیل با ارائه ی روشی برای حذف این نواحی توانست بهبود قابل ملاحظه-ای ایجاد کند ولی این روش به دلیل هزینه محاسباتی زیاد برای تعداد 8 گوینده اجرا شد. در این پایان نامه از gmm-ubm به دلیل حجم محاسبت کمتر و سرعت بالاتر استفاده شد. این مدل با ساخت یک مدل کلی برای همه ی افراد و سپس بروزرسانی کردن مدل برای تک تک افراد حجم محاسبات را کم کرده و قابلیت محاسبه ی سریع امتیازات را دارا می-باشد لذا باعث افزایش سرعت سیستم می شود. با بکارگیری gmm-ubm در روش مبتنی بر حذف نواحی همپوشانی ما توانستیم یک سیستم بازشناسی گوینده به ازای 70 گوینده تعلیم داده و بطور میانگین صحت شناسایی را به میزان1/1درصد برای دادگان تست با طول 5 ثانیه تا 2/4 درصد برای دادگان تست با طول 5 دقیقه نسبت به gmm-ubm افزایش دهیم.