نام پژوهشگر: بهداد دشت بزرگ
بهداد دشت بزرگ حمیدرضا ابوطالبی
با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته است که در همه این کاربردها وجود نویز و پژواک به عنوان عامل مخرب شناخته می شود. در طول چند دهه اخیر روش های متعددی برای حذف و کاهش پژواک ارائه شده که عمدتاً در دو دسته تک میکروفونه و چندمیکروفونه تقسیم می شود. در سیستم های تک میکروفونه نوعاً روش های طیفی کاهش پژواک مورد استفاده قرار می گیرد در حالی که در روش های مبتنی بر آرایه میکروفونی پردازش های مکانی مبنای کار می باشد. در این پایان نامه پس از بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز از جمله دو روش تخمین مرتبه متغیر mmse و omlsa، با ترکیب این دو، روش جدیدammse ارائه شده است. این روش دارای دو پارامتر مرتبه تخمین و احتمال شرطی حضور گفتار است. در ادامه، روش جدیدی برای محاسبه مرتبه تخمینammse ارائه داده ایم که بر خلاف روش های گذشته، این پارامتر را نه تنها برای هر فریم، بلکه برای هر مولفه فرکانسی به صورت جداگانه محاسبه می نماید. برای محاسبه مرتبه تخمین، رابطه ای خطی با احتمال شرطی حضور گفتار برای آن تعریف کرده و همچنین تأثیر انتخاب مقادیر منفی را برای این پارامتر بررسی نموده ایم. در ادامه، تعمیم روش پیشنهادی ammse در شرایط که پژواک حضور دارد، ارائه شده است و کارایی آن در محیط های واقعی که به طور همزمان دارای نویز و پژواک است مورد بررسی قرار گرفته است. در ادامه این پایان نامه، به ترکیب روش های پردازش مکانی و پردازش طیفی در سیستم های آرایه میکروفونی پرداخته و از میان پردازنده های مکانی، gsc و نمونه مناسب تر آن برای کاربرد حذف پژواک، یعنی tf-gsc را انتخاب کرده ایم. و با قرار دادن تخمین گر ammse در خروجی پردازنده های مکانی، دو ساختار ترکیبی جدید به نام های gsc-ammse وtf-gsc-ammse ارائه نموده ایم. نشان داده شده است که gsc-ammse کارایی چشمگیری در کاهش نویز دارد و روش tf-gsc-ammse نیز مقدار نویز و پژواک را به مقدار قابل توجهی کاهش می دهد.