نام پژوهشگر: اشکان نیک آیین
اشکان نیک آیین محسن رحمانی
کاهش نویز در بسیاری زمینه ها از جمله بهبود سیگنال ورودی پردازشگرهای صوتی جهت تشخیص گفتار و یا شناسایی گوینده و نیز گوشی های تلفن همراه و ... دارای اهمیت زیادی می باشد. تاکنون روشهای بسیاری جهت بهبود و اصلاح سیگنال گفتار با استفاده از طیف فرکانسی دوره کوتاه سیگنال گفتار ارائه شده اند. عموم این روشها فیلتری را ارائه می دهند که بهره آن تابعی از نسبت سیگنال به نویز بوده و در حوزه فرکانس پس از اعمال به طیف فرکانسی سیگنال نویزی، تخمینی از طیف فرکانسی سیگنال تمیز را به دست می دهند. این فیلترها دارای مقداری بین صفر و یک هستند. در فرکانسهایی که نسبت سیگنال به نویز بالاست، سعی در تقویت سیگنال می نمایند و بر عکس در فرکانسهای با نسبت سیگنال به نویز پایین، در جهت کاهش مولفه فرکانسی عمل می کنند. در این پایان نامه فیلترهایی جهت اصلاح طیف فرکانسی ارائه می شوند که برای تولید آنها از شبکه های عصبی استفاده می گردد. ورودیهای فیلتر که در اصل یک شبکه عصبی است فیلترهای پایین گذر مرتبه اول و یا شبکه های بازگشتی مرتبه اول هموارکننده ایست که جهت هموارسازی طیف توان کوتاه مدت سیگنال نویزی استفاده می شوند. در این پایان نامه سعی شده است روشی برای کاهش نویز از سیگنال گفتار دیجیتال با استفاده از شبکه های عصبی به منظور بهبود سیگنال توسط اصلاح طیف فرکانسی ارائه شود. در عمل چندین نوع فیلتر بر حسب نوع خروجی در نظر گرفته شده، بررسی شده و بهترین آنها معرفی می شود. در نهایت نتایج اعمال این فیلتر بر روی تعداد زیادی سیگنال نویزی با نتایج فیلتر تفاضل طیف توان، و با استفاده از معیارهای pesq ، nplr و snri مقایسه گردیده اند. با توجه به این که فیلتر تفاضل طیف توان مورد استفاده از پس پردازشگر جهت حذف نویز موسقیایی و شکل دهی نویز استفاده می کند، با این وجود نتایج حاصل از فیلتر شبکه عصبی معرفی شده کاملاً نزدیک به نتایج حاصل از اعمال فیلتر تفاضل طیف توان می باشد.