نام پژوهشگر: احسان شاهزیدی
احسان شاهزیدی حمیدرضا ابوطالبی
مکان یابی منبع گفتار در بسیاری از سیستم های پردازش گفتار از قبیل سیستم های تله کنفرانس، سیستم های بازشناسی گفتار، اتاق های کنفرانس هوشمند و سیستم های کمک شنوایی کاربرد دارد. مکان یابی منابع صوتی برای مشخص نمودن مکان دقیق یک یا چند منبع استفاده می شود که توسط روش های مختلفی انجام می گیرد. در این پایان نامه مکان یابی بر اساس آنالیز ویژه مدنظر است که اساس کار این روش ها، تجزیه ی ماتریس همبستگی میکروفون ها به فرم ویژه است. با تجزیه به فرم ویژه ی ماتریس همبستگی، بردار ویژه ها و مقادیر ویژه هایی بدست می آید که تشکیل دو زیر فضا (زیر فضای سیگنال و زیر فضای نویز) می دهند. در این پایان نامه نخست به بررسی روش های مختلف تخمین جهت منبع صوتی مبتنی بر آنالیز ویژه می پردازیم. نشان می دهیم روش های تخمین جهت منبع مبتنی بر توابع amdf وamsf در برابر روش های مبتنی بر همبستگی، حجم محاسباتی کمتر و دقت مناسبی دارند. در این تحقیق روش mamdf که از ترکیب توابع amdf و amsf بدست می آید را برای تخمین جهت منبع سیگنال نیز معرفی می کنیم و نشان می دهیم این تابع دقت بیشتری نسبت به بقیه روش های تخمین جهت منبع دارد. همچنین در نسبت سیگنال به نویزهای پایین با حذف نویز از بزرگترین مقدار ویژه اقدام به بهبود روش های تخمین جهت منبع می نمائیم. سپس به بررسی روش های تخمین تأخیر زمانی مبتنی بر آنالیز ویژه می پردازیم. با ترکیب اطلاعات حاصل از تخمین تأخیر زمانی بین جفت میکروفون ها، می توان به مکان دقیق منبع دست یافت. ضعف اکثر روش های تخمین تأخیر زمانی در شرایط نویزی است. با استفاده از بردار ویژه ی زیر فضای سیگنالی و حذف نویز در این زیر فضا، می توانیم در روش های تخمین تأخیر زمانی بهبود قابل توجهی ایجاد نماییم.