حمیدرضا ابوطالبی

بهبود عملکرد سیستم های مکان یابی منبع گفتار در محیط های واقعی

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
علی دهقان فیروزآبادی حمیدرضا ابوطالبی

مکان یابی منبع گفتار یکی از زیر شاخه های سیستم های پردازش گفتاری می باشد. در این پژوهش مکان یابی منبع گفتار با استفاده از روش های مبتنی بر srp مدنظر بوده است. روش استفاده شده در این پژوهش روش srp-phat است. روش srp-phat در مکان یابی منبع گفتار تحت شرایط انعکاسی، مقاوم می باشد. در حقیقت این روش که بر مبنای شکل دهی پرتو آرایه میکروفونی بنا نهاده شده است، سعی می کند با جستجوی فضا، ماکزیمم انرژی در فضا را پیدا کند. به همین منظور این روش برای مکان یابی نیازمند جستجوی کامل فضا می باشد. این امر باعث می شود که روش srp-phat حجم محاسبات بالایی را به خود اختصاص بدهد. روش های مختلفی از جمله src و cfrc برای کاهش حجم محاسبات معرفی شده اند که سعی می کنند طی یک فرآیند تکرار شونده، فضای جستجو را کوچک و کوچک تر کرده تا به مکان منبع منتهی شود. در این پژوهش روش srp-phat و روش های کاهش حجم محاسبات src و cfrc تحت سه سناریوهای مختلف شبیه سازی شده است: محیط نویزی، محیط انعکاسی و محیط نویزی و انعکاسی توأم. همچنین آزمایش ها برای سه موقعیت مختلف گوینده، انجام شده است: گوینده جلوی آرایه، گوینده در کنار آرایه و گوینده در گوشه ی اتاق. در ادامه روش هایی برای کاهش بیشتر حجم محاسبات و افزایش دقت روش srp-phat ارائه شد. روش جستجوی فضا بر مبنای تخمین doa و فضای قطاع بندی شده از روش هایی بود که در این پژوهش مطرح گردید. نشان داده شد که این روش حجم محاسبات را به مقدار قابل توجهی کاهش داده و همچنین باعث افزایش دقت روش srp-phat می شود. در ادامه دو شکل آرایه ای جدید پیشنهاد شد که باعث افزایش دقت سیستم مکان یابی منبع گفتار شدند. در انتها نیز روش جدید مکان یابی srp-ml پیشنهاد شده است که در شرایط نویزی و نیز نویزی و انعکاسی توأم، دقت به مراتب بالاتری را نسبت به روش srp-phat دارا می باشد. دقت این روش در شرایط انعکاسی کمی بدتر از روش srp-phat است.

نام پژوهشگر: حمیدرضا ابوطالبی