نام پژوهشگر: زینب محمدپوری

کاربرد مدل مخلوط لاپلاس در بهسازی گفتار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود 1389
  زینب محمدپوری   امید رضا معروضی

بهسازی گفتار یا speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. از مهم ترین روش های بهسازی گفتار، روش های آماری هستند که به لحاظ کارایی بالاتر نسبت به سایر روش ها و ایجاد اعوجاج کمتر در سیگنال نهایی بیشتر مورد توجه می باشد. در این روش یک مدل آماری برای گفتار و نویز فرض می شود و پردازش ها بر مبنای این مدل صورت می گیرد. این مدل آماری برای ضرایب فوریه یا پارامترهای دیگر هر قاب سیگنال گفتار یا نویز فرض می شود. در این پایان نامه، روش آماری جدیدی برای تخمین سیگنال تمیز از روی سیگنال نویزی در حضور نویز جمع شونده و مستقل از سیگنال تمیز، در حوزه فرکانس ارائه شده است. تا کنون از مدل های گوسی، لاپلاس، گاما و مخلوط گوسی ، برای مدل کردن طیف سیگنال گفتار استفاده شده؛ اما در این پایان نامه، توزیع مخلوط لاپلاس برای مدل کردن بخش های حقیقی و موهومی طیف گفتار پیشنهاد شده است. پارامترهای این مدل (میانگین ها، واریانس ها و ضرایب) به صورت برون خطی و با استفاده از الگوریتم em و سیگنال صحبت بدون نویز از پایگاه داده timit محاسبه شده است. سپس رابطه تخمین گرmmse یا کمترین میانگین مربعات خطا، با توجه به توزیع مخلوط لاپلاس به دست آورده شده است. واریانس نویز به صورت درون خطی و با استفاده از روش ردیابی کمینه ها به دست آمده است. در نهایت برای ارزیابی و عملکرد روش پیشنهادی از سه معیار سیگنال به نویز قطعه ای،pesq و log likellihood ratio (llr) استفاده شده؛ و روش پیشنهادی با روشهایی که مدل گوسی و لاپلاس را برای سیگنال تمیز فرض کرده اند، مقایسه شده است. بررسی نتایج بیانگر عملکرد قابل قبول روش پیشنهادی است.