نام پژوهشگر: سونای کمی
سونای کمی محمدرضا کرمی
سیگنال های گفتار به ندرت به صورت خالص برای کاربرد های پردازش گفتار موجود می باشند و اغلب به وسیله ی تداخل آوایی نظیر نویز پس زمینه، اعوجاج، سیگنال گفتار گوینده ی دیگر و ... مخدوش می شوند. در چنین حالتی لازم است که ابتدا سیگنال گفتار از پس زمینه جدا شود. به ویژه عمل جداسازی گفتار چند گوینده که به عنوان جداسازی گفتار شناخته می شود امری چالش برانگیز است زیرا شامل جداسازی سیگنال هایی است که دارای مشخصات آوایی و آماری بسیار مشابهی هستند. چالش برانگیز ترین حالت جداسازی گفتار، جداسازی سیگنال های گفتار ناشی از رکورد تک کاناله است؛ مسئله ای که معمولاً به عنوان جداسازی گفتار تک کانال شناخته می شود. سیستم های جداسازی گفتار تک کانال با کیفیت بالا هنوز از اهمیت زیادی برخوردارند و به عنوان یک مسئله ی حل نشده باقی مانده اند. هدف این پایان نامه، ارائه ی راهکار هایی برای بهبود سیستم های جداسازی گفتار تک کانال می باشد. یک سیستم موثر جداسازی گفتار تک کانال، پیش پردازشی مهم در کاربرد های بسیاری نظیر شناسایی اتوماتیک گفتار و تعیین هویت گوینده به شمار می رود. این پایان نامه روی جداسازی مبتنی بر مدل گفتار تک کانال متمرکز میشود که به تکنیک هایی اطلاق می شود که از مدل های آموزش داده شده ی منابع استفاده می کنند تا منابع را از رکورد تک کاناله ی ترکیب خطی آنها جدا کنند. اولین راهکار پیشنهادی در این پایان نامه جداسازی منابع در سطح زیربخش و اعمال این رویکرد به روش مبتنی بر تخمین حداکثر احتمال پسین و روش مبتنی بر کوانتیزاسیون بردار می باشد. در راهکار پیشنهادی دوم، روش مبتنی بر تخمین حداکثر احتمال پسین برای حالتی که در آن سیگنال های تست و آموزشی سطح انرژی مختلفی نسبت به هم دارند (منابع بهره مختلفی دارند) بسط داده می شود. این حالت در بسیاری از روش های مبتنی بر مدل جداسازی گفتار تک کانال در نظر گرفته نشده است. روش هایی که این حالت را در نظر می گیرند به روش های وفق بهره موسوم اند. اگرچه روش های وفق بهره ی موجود در تخمین بهره ی منابع موفق عمل می کنند اما از پیچیدگی محاسباتی و زمان پردازش بالایی برخوردارند. روش پیشنهادی سوم بر مبنای جداسازی زیربخشی و کوانتیزاسیون بردار تلاشی برای غلبه بر این محدودیت است. نتایج تجربی نشان می دهند که راهکار های پیشنهادی، عملکرد سیستم جداسازی گفتار تک کانال را بهبود می دهند.