صنم ایمانی شاملو

نام پژوهشگر: صنم ایمانی شاملو

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز 1390
صنم ایمانی شاملو مسعود گراوانچی زاده

حضور نویز در محیط های طبیعی غیرقابل اجتناب است. استخراج گفتار مورد نظر (هدف) از نویز پس زمینه دارای حوزه کاربرد وسیعی از قبیل تشخیص خودکار گفتار، وسایل کمک شنوایی و سیستم های مخابراتی راه دور میباشد. یک شنونده انسانی توانایی قابل توجهی در جداسازی ترکیب صوتی و توجه به یک صوت هدف دارد. این فرآیند ادراکی، آنالیز ترکیب شنیداری (auditory scene analysis) نامیده میشود. هدف آنالیز ترکیب شنیداری محاسباتی (computational auditory scene analysis) شبیه سازی عمل پردازش صوت توسط انسان میباشد. بسیاری از کاربردها، نظیر مخابرات راه دور و بازیابی اطلاعات صوتی، نیازمند راه حل تک گوشی هستند. برای سیگنال های تک گوشی (تک میکروفونه)، باید ویژگیهای ذاتی گفتار یا تداخل در نظر گرفته شوند. در این پایاننامه، اساس فرآیند جداسازی منحنی گام است که ابتدا، از گفتار جدا شده، بر اساس گام غالب، تخمین زده شده و سپس، با توجه به شرط های روانی-صوتی (psychoacoustic) تصحیح میشود. مشکل اصلی در سیستمهای پیشین casa، جداسازی نامناسب گفتار صدادار در ناحیه فرکانس بالا میباشد. در این پایاننامه، دو الگوریتم جدید برای بهبود فرآیند جداسازی گفتار صدادار، به ویژه در ناحیه فرکانس بالا، پیشنهاد شده است. الگوریتم اول از تابع خود-همبستگی پوش بهبود یافته (enhanced envelope autocorrelation function) و همبستگی پوش پاسخ بین کانالی برای برچسب گذاری واحدهای زمان-فرکانسی استفاده میکند. الگوریتم دوم مبتنی بر کلاس بندی واحدهای زمان-فرکانسی به گفتار صدادار و نویز غیرگفتار، در ناحیه فرکانس بالا، میباشد. نتایج مقایسه روشهای پیشنهادی با مدل hu, wang نشان میدهد که بطور کلی، فرآیند جداسازی گفتار صدادار به طور قابل توجهی در ناحیه فرکانس بالا بهبود یافته و در عین حال ردیابی گام بهتری صورت گرفته است. همچنین، الگوریتم پیشنهادی دوم نتایج بهتری را نسبت به الگوریتم اول، در امر جداسازی گفتار صدادار از نویزهاای غیرگفتار، ارائه میدهد.

۱۵ صفحه ی اول