نام پژوهشگر: مهدی فلاح معافی
مهدی فلاح معافی ابوالقاسم صیادیان
در این پایان نامه روشهای جداسازی سیگنالهای گوینده و موزیک، زمانی که فقط به سیگنال مخلوط دریافت شده از یک میکروفون دسترسی داریم مورد بررسی قرار می گیرد. بطور کلی روشهای جداسازی سیگنال در حالت تک میکروفونه به دو گروه تقسیم می شود : گروه اول روش هایی را شامل می شوند که اصول حاکم بر سیستم شنوایی را برای جداسازی انتخاب می کنند و گروه دوم روش هایی که با استفاده از اطلاعات قبلی از دو منبع، جداسازی را انجام می دهند. با توجه به تحقیقاتی که صورت گرفته در این پایان نامه روش گروه دوم مورد بررسی قرار می گیرد و هدف این پایان نامه بهبود روشهی مبتنی بر مدل برای بهتر جداسازی منابع صوتی می باشد. غالبا در مدل سازی منابع از مدل مخلوط گوسی و مدل چندی سازی برداری استفاده می شود به علت دقیقتر بودن مدل چندی سازی برداری نسبت به مدل مخلوط گوسی از این مدل در این پروژه استفاده شده است و روشهایی جهت بهبود مدل سازی چندی سازی برداری ارایه شده است. برای جداسازی سیگنالهای منابع از فریم سیگنال مخلوط تخمین های mixmax،meanmix، maxlmix و psdmix ارایه شده است و نتایج نشان می دهد که تخمین psdmix نسبت به تخمین های دیگر بهینه است. در فاز جداسازی، دو روش فیلتر ماسک و جداسازی مبتنی بر عناصر کتاب کد ارایه گردیده است. در روش فیلتر ماسک با استفاده از ماسک های خطی و غیر خطی کیفیت صدای جداسازی شده بهبود داده شده است. در این روش با استفاده از استدلال ریاضی نشان داده می شود که نوعی فیلتر ماسک غیر خطی بهینه برای هر یک از تخمین ها وجود دارد. در روش جداسازی مبتنی بر عناصر کتاب کد، برای بهبود صدای جدا سازی شده از فاز طبیعی بردارهای آموزشی و همزمان سازی بین فریم ها متوالی استفاده می شود تا صدای جداسازی شده از لحاظ معیارهای شنوایی بهبود یابد. در نهایت روشهای مذکور بر روی داده های عملی واقعی پیاده سازی شد. و به نتایج امیدوار کننده ای منتج گردید.