نام پژوهشگر: حمیدرضا ابوطالبی
علی دهقان فیروزآبادی حمیدرضا ابوطالبی
مکان یابی منبع گفتار یکی از زیر شاخه های سیستم های پردازش گفتاری می باشد. در این پژوهش مکان یابی منبع گفتار با استفاده از روش های مبتنی بر srp مدنظر بوده است. روش استفاده شده در این پژوهش روش srp-phat است. روش srp-phat در مکان یابی منبع گفتار تحت شرایط انعکاسی، مقاوم می باشد. در حقیقت این روش که بر مبنای شکل دهی پرتو آرایه میکروفونی بنا نهاده شده است، سعی می کند با جستجوی فضا، ماکزیمم انرژی در فضا را پیدا کند. به همین منظور این روش برای مکان یابی نیازمند جستجوی کامل فضا می باشد. این امر باعث می شود که روش srp-phat حجم محاسبات بالایی را به خود اختصاص بدهد. روش های مختلفی از جمله src و cfrc برای کاهش حجم محاسبات معرفی شده اند که سعی می کنند طی یک فرآیند تکرار شونده، فضای جستجو را کوچک و کوچک تر کرده تا به مکان منبع منتهی شود. در این پژوهش روش srp-phat و روش های کاهش حجم محاسبات src و cfrc تحت سه سناریوهای مختلف شبیه سازی شده است: محیط نویزی، محیط انعکاسی و محیط نویزی و انعکاسی توأم. همچنین آزمایش ها برای سه موقعیت مختلف گوینده، انجام شده است: گوینده جلوی آرایه، گوینده در کنار آرایه و گوینده در گوشه ی اتاق. در ادامه روش هایی برای کاهش بیشتر حجم محاسبات و افزایش دقت روش srp-phat ارائه شد. روش جستجوی فضا بر مبنای تخمین doa و فضای قطاع بندی شده از روش هایی بود که در این پژوهش مطرح گردید. نشان داده شد که این روش حجم محاسبات را به مقدار قابل توجهی کاهش داده و همچنین باعث افزایش دقت روش srp-phat می شود. در ادامه دو شکل آرایه ای جدید پیشنهاد شد که باعث افزایش دقت سیستم مکان یابی منبع گفتار شدند. در انتها نیز روش جدید مکان یابی srp-ml پیشنهاد شده است که در شرایط نویزی و نیز نویزی و انعکاسی توأم، دقت به مراتب بالاتری را نسبت به روش srp-phat دارا می باشد. دقت این روش در شرایط انعکاسی کمی بدتر از روش srp-phat است.
محمدرضا جعفرپوربغدادآباد عباسعلی حیدری
تخمین فاصله و زاویه ی مسیر سیگنال دریافتی منابع با استفاده از آنتنهای آرایهای در دو دهه ی اخیر مورد توجه ویژه قرار گرفته و موضوع پژوهشهای بسیاری بوده است. در این پایان نامه تعدادی از روشهای تخمین زاویه ی ورود منابع سیگنال باند باریک و همچنین برخی روشهای تخمین تعداد منابع سیگنال بررسی و شبیهسازی شده و با یکدیگر مقایسه شده اند. تکنیک های زیادی برای تخمین زاویه ی ورود منابع ارائه شدهاند. از جمله روشهای موجود برای تخمین زاویه ی ورود میتوان روشهای مبتنی بر جهت دهی پرتو، روش های مبتنی بر زیر فضا و همچنین روش هایی که از معیار حداکثر درست نمایی استفاده می نمایند، را نام برد. معمولاً همراه با روشهای تخمین جهت منابع، از روشهای تخمین تعداد منابع مانند mdl و aic هم استفاده می شود، این روش ها از تئوری اطلاعات استفاده می کنند. در این پایان نامه برای بالا بردن دقت تخمین و قدرت تفکیک زاویه ی ورود، روشی جدید با استفاده از تفاضل مرتبه دوم ارائه گردیده است که با محاسبه ی تفاضل مرتبه دوم از طیف روش های زیرفضا و جهت دهی پرتو، دقت الگوریتم ها در تشخیص زوایای نزدیک را بهبود می دهد. بدین ترتیب خطای تخمین زاویه ورود بهطور چشمگیری کاهش مییابد. همچنین روش دیگری بر مبنای تجزیه ماتریس کوواریانس داده های خروجی آرایه، پیشنهاد شده است که بدون نیاز به تعداد منابع می تواند راستای ورود سیگنال ها را محاسبه کند، دقت این روش از الگوریتم های زیرفضا کمتر است، ولی مزیت آن این است که به صورت کور راستای ورود سیگنال ها را پیدا می کند. در نهایت نتایج شبیهسازی روشهای بیان شده، ارائه شده است.
کوکب کجباف زاده عباسعلی حیدری
در این پایان نامه آنتن هوشمند به عنوان وسیله ای در جهت بهبود کیفیت سیستم های مخابرات بی سیم مورد بررسی قرار گرفته است. ابتدا به معرفی انواع آنتن های هوشمند پرداخته و نحوه ی عملکرد آنها شرح داده شده است. از آنجایی که آنتن های وفقی گروه مهمی از آنتن های هوشمند هستند و امروزه بیش از پیش مورد توجه قرار گرفته اند در ابتدا چند الگوریتم وفقی متداول معرفی شده و سپس با انجام شبیه سازی، سه الگوریتم کاربردی در زمینه آنتن هوشمند مورد مقایسه قرار داده و مشاهده شده است که الگوریتم lms از دو الگوریتم rls و dmi کندتر است و حجم محاسبات کمتری دارد و در عوض بسیار ساده تر است. الگوریتم rls سریعتر از الگوریتم lms همگرا می شود و الگوریتم dmi از دو الگوریتم دیگر سریعتر عمل می کند ولی به دلیل نیاز به محاسبه ماتریس معکوس در هر مرحله، نیاز به پردازشگر قوی دارد. همچنین عملکردالگوریتم dmi به ازای بلوکهای مختلف تخمین ماتریس همبستگی مورد بررسی و شبیه سازی قرار گرفته است. در نهایت با مقایسه بهبود نرخ خطای بیت در گیرنده با استفاده از هر کدام از الگوریتم ها، مشاهده شده است که بهبود نرخ خطای بیت با استفاده از الگوریتم dmi بیشتر است. در ادامه به کمک الگوریتم ژنتیک چند آرایه دایره ای هم مرکز به گونه ای بهینه سازی شده است که سطح پرتوهای کناری تا حد امکان کوچک شود. با انجام این کار به دلیل کاهش سیگنالهای تداخل در سیستم مخابرات بی سیم، نرخ خطای بیت کاهش یافته و ظرفیت سیستم افزایش می یابد. به عنوان نمونه برای آرایه دایره ای هم مرکز که در دایره داخلی 5 المان و در دایره خارجی 7 المان دارد، سطح پرتوی کناری با استفاده از الگوریتم ژنتیک نسبت به آرایه با فاصله بین المانی نصف طول موج، حدود 4/4 دسی بل کاهش یافته است. در انتها، روشی برای محاسبه ظرفیت یک سلول ایزوله با استفاده از آنتن هوشمند در مقایسه با آنتن همه جهته ارائه شده و از طریق شبیه سازی الگوی تابش آرایه خطی یکنواخت و آرایه دایره ای یکنواخت، بهبود ظرفیت سیستم برای این دو آرایه مورد ارزیابی قرار گرفته است .
پریناز خیری حمیدرضا ابوطالبی
در این پایان نامه برای بهسازی گفتار با استفاده از آرایه میکروفونی، از شکل دهنده پرتو و به دنبال آن از یک پسافیلتر استفاده شده است. برای این منظور بر روی شکل دهنده پرتو فوق جهتی، در دو حوزه پردازشی میدان-دور و میدان-نزدیک تمرکز شده است. از آن جا که گفتار سیگنالی باندوسیع است، برای بهبود عملکرد سیستم، شکل دهنده پرتو فوق جهتی به صورت زیر آرایه ای، پیاده سازی گردیده است. در ادامه، با ترکیب شکل دهنده پرتو فوق جهتی با ساختار generalized sidelobe canceller کارایی ساختار، به ویژه در حذف نویزهای جهتی ارتقاء یافته است. برای این منظور در یک آزمایش از یک آرایه میکروفونی lشکل و با استفاده از gsc، ساختار gsc-sdb ارزیابی شده و در آزمایشی دیگر با استفاده از lcmv به جای blocking matrix، ساختارgsc-sdb برای زوایای دید دلخواه تعمیم داده شده است. سپس این ایده برای شرایط میدان-نزدیک نیز ارزیابی شده است. به منظور بهبود عملکرد سیستم چندکاناله، در خروجی شکل دهنده پرتو از پسافیلتر استفاده شده است. برای این منظور، پسافیلترهای تک کاناله و چندکاناله مورد توجه قرار گرفته است. در ادامه عملکرد پسافیلتر mccowan در محیط های نویزی واقعی، با بدست آوردن تابع همدوسی از سیگنال های ورودی آرایه به نحو قابل توجهی بهبود داده شده است. همچنین با بکارگیری الگوریتمی مشابه mccowan بر روی پسافیلتر stsa(short time spectral amplitude)، تغییرات عملکرد این پسافیلتر در شبیه سازی بررسی شده است. در نهایت ایده استفاده از پسافیلتری با ترکیب پسافیلترهای چندکاناله و تک کاناله و برای مرتفع کردن نارسایی های این ایده از پسافیلتر زیرباندی که در آن برای هر زیرباند از پسافیلتری مناسب آن زیرباند استفاده می شود، ارائه شده و عملکرد مناسب آن مشاهده گردیده است.
هدیه هلی حمیدرضا ابوطالبی
مکان یابی منبع گفتار در بسیاری از سیستم های پردازش گفتار از قبیل سیستم های تله کنفرانس، سیستم های بازشناسی صوت، اتاق های کنفرانس هوشمند و سیستم های کمک شنوایی کاربرد دارد. امروزه مکان یابی منبع صوت با کمک آرایه های میکروفونی از موضوعات مورد توجه می باشد. این آرایه ها در نهایت سیگنال دارای کیفیت مطلوب را از منبع صوتی تهیه می کنند و منابع صوتی غیر دلخواه را حذف می کنند. اما یکی از چالش های پیش رو در کاربردهای ذکر شده، بحث مکان یابی چند گوینده همزمان است. در این پایان نامه به بررسی یکی از روش های مکان یابی چندین گوینده همزمان که بر اساس الگوریتم های جداسازی کور منابع (bss) است، می پردازیم. bss را می توان به صورت مجموعه ای از شکل دهنده های پرتو صفر و تطبیقی کور درنظر گرفت. در حقیقت در حالی که برای یافتن مکان منابع، به اطلاعاتی در مورد مکان منابع نیاز داریم تا شکل دهنده پرتو را به سمت آن ها هدایت کنیم، bss بدون داشتن این اطلاعات اولیه، امکان بازیابی سیگنال ها را از سیگنال های ضبط شده در میکروفون ها -که ترکیبی از سیگنال های همزمان هستند- فراهم می کند. این به آن معناست که فیلترهای جداکننده bss حاوی اطلاعات مهمی در مورد مکان منابع هستند. در نهایت با توجه به فیلترهای جداکننده حاصل از الگوریتم bss، می توان الگوی تشعشعی بدست آورد که با یافتن مینیمم ها در این الگو، قادر به تخمین مکان منابع هستیم. در این پایان نامه به منظور بهبود عملکرد الگوریتم مکان یابی در محیط های انعکاسی، روشی پیشنهاد کردیم که در آن تنها بزرگترین ضریب فیلترهای جداکننده که متناظر با مسیر مستقیم است را درنظر گرفته و الگوی تشعشعی را محاسبه می کنیم. همچنین برای کاهش بار محاسباتی، محدوده فرکانسی موردنظر برای فرآیند متوسط گیری را کاهش می دهیم. نتایج شبیه سازی گویای دقت بالاتر الگوریتم پیشنهادی در تخمین مکان منابع همزمان نسبت به روش های مشابه می باشد
الهام امامی میبدی حمیدرضا ابوطالبی
نمایش های تُنُک، ابزار قدرتمندی را در آنالیز و پردازش سیگنال های گفتار و صوت ایجاد کرده اند و تنکی به صورت یک مفهوم کلیدی و مهم در زمینه های مختلفی چون جداسازی کور منابع، فشرده سازی، نمونه برداری و آنالیز سیگنال در آمده است. هدف از این پایان نامه، بررسی تنکیِ سیگنال گفتار در حوزه های مختلف و استفاده از نتایجِ این بررسی در مسأله ی بهسازی گفتار است. با توجه به اینکه در کاربردهای مختلف، تعابیر متفاوتی از تنکی وجود دارد، از این رو ابتدا به بررسی و تشریحِ مفاهیم و اصول کلیِ تنکی یک سیگنال می پردازیم. در این راستا شش ویژگی را برای یک معیار تنکی بیان کرده و این شش ویژگی را مبنای مقایسه ی معیارهای مطرح در زمینه ی تنکی قرار می دهیم. با بررسی هایی که انجام می دهیم، سه معیارِ gini، hoyer و kurtosis به عنوان معیارهای کارا و مناسب در سنجش میزانِ تنکی انتخاب می کنیم. نتایج حاصل از اعمال این سه معیار به سیگنال های گفتار در حوزه های مختلف (شامل حوزه ی زمان، dct، mdct، stft، dwt، gabor، mclt)، تبدیل های dct و mdct را به عنوان حوزه هایی که تنک ترین نمایش از سیگنال گفتار را موجب می شوند، معرفی می نماید. همچنین نشان داده می شود که تبدیل dct در مقایسه با تبدیل mdct خطای کمتری را در بازسازی دارد. در ادامه ی این تحقیق، موضوعِ بهسازی گفتار در تنک ترین حوزه (حوزه یِ dct) بر اساس ویژگی های سیگنال گفتار مورد بررسی قرار گرفته است. بدین منظور پس از بررسی روش های کلاسیک آستانه گذاری در حوزه ی dct و مزایا و معایب آنها، یک الگوریتم آستانه گذاری بر اساس واکداری یا بی واکی هر فریم پیشنهاد و پیاده سازی گردیده و عملکرد آن در مواجهه با سیگنال گفتار نویزی (در شرایط مختلف) مورد ارزیابی قرار گرفته است.
محبوبه کارگریان مروستی حمیدرضا ابوطالبی
با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین دامنه طیف سیگنال گفتار و هم چنین تخمین ضرایب حقیقی و موهومی طیف گفتار مبتنی بر معیار mmse و map و با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار ارائه شده اند. در سال های اخیر محققان به دنبال واردکردن مدل های احتمالاتی دقیق تری برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند . در این پایان نامه، ابتدا به بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار و هم چنین سیستم تک کاناله تخمین مولفه های دکارتی ضرایب سیگنال تمیز با همان فرض گوسی بودن ضرایب می پردازیم . در ادامه نگاهی به سیستم های بهسازی که مبتنی برفرض غیرگوسی برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند، داریم . در این زمینه، نخست به کمک معیار kullback به دنبال تابع توزیعی هستیم که بر هیستوگرام دامنه گفتار منطبق شود . در این راستا با استفاده از توزیع سوپرگوسین و با تغییر پارامترهایش از نظر معیار kullback به توزیع نمایی رسیدیم که بر هیستوگرام دامنه گفتار منطبق تر است و تخمین گر دامنه طیف سیگنال گفتار را با فرض توزیع نمایی برای دامنه گفتار براساس معیار mmse بدست آوردیم . در ادامه این پایان نامه ، روش تخمین مرتبه متغیر mmse با فرض سوپرگوسین بودن دامنه گفتار را مورد بازنگری قرار داده و تخمین گرهای جدید را استخراج می کنیم. شبیه سازی ها نشان می دهند که با در نطرگرفتن توزیع نمایی برای دامنه گفتار نسبت به حالتی که ضرایب توزیع لاپلاس یا گوسی دارند بهسازی بیشتری از نظر معیار segsnr بدست می آید .
مهدی آزادی حمیدرضا ابوطالبی
تخمین مقادیر tdoa (time differential of arrival) یکی از روش های پایه ای در مکان یابی منابع گفتار می باشد که به طور وسیع مورد بررسی قرار گرفته است. در دهه ی اخیر تحقیقات زیادی بر روی تخمین مقادیر tdoa با استفاده از فیلترهای بازترکیب مستخرج از جداسازی کور منابع، صورت گرفته است. در این پژوهش ضمن معرفی چندین روش از روش های مطرح شده در سال های اخیر، به بررسی و پیاده سازی روش sct (state coherence transform) پرداخته و نقاط ضعف و قوت آن را بررسی می کنیم. در ادامه ضمن معرفی مشکل الیاسینگ فضایی که در صورت عدم رعایت نرخ نمونه برداری مکانی مناسب توسط میکروفون ها بوجود می آید، روش msct (modified sct) برای بهبود عملکرد مکان یابی در فواصل میکروفونی زیاد و کاهش اثر الیاسینگ فضایی پیشنهاد می شود که خطای مکان یابی در فاصله ی میکروفونی l=1m را 1/74% کاهش می دهد. با توجه به کاهش دقت عملکرد روش msct در شرایط نویزی، با وزن دهی روش msct که آن را wsct (weighted sct) می نامیم، خطای مکان یابی در محیط های نویزی با snr=5db را به میزان 89/82% کاهش می دهیم. در ادامه، با توجه به روند کاهشی دقت تخمین مقادیر tdoa با استفاده از روش های فوق در محیط های پژواکی، روش cc-bss (cross correlation blind source separation) با استفاده از همبستگی متقابل درایه های فیلتر بازترکیب مستخرج از bss، معرفی می شود که در محیط با زمان انعکاس 700میلی ثانیه خطای sct را به میزان 21/34% کاهش می دهد. سپس با پیاده سازی این روش در حوزه ی فرکانس و وزن دهی آن، روش gcc-bss (generalized cc-bss) معرفی می شود که در آن از دو فیلتر گوسی و phat (phase transform) برای وزن دهی استفاده می کنیم که روش gcc-bss-phat در محیط با زمان انعکاس 700میلی ثانیه خطای مکان یابی با استفاده از روش cc-bss را به میزان 66/41% کاهش می دهد. کلمات کلیدی: مکان یابی، tdoa، جداسازی کور منابع، الیاسینگ فضایی، فیلتر phat
آذر محمودزاده حمید سلطانیان زاده
در یک مهمانی، ما می توانیم به یک صدای خاص توجه ویژه داشته باشیم و دیگر صداهای تداخلی موجود در محیط اطراف خود را فیلتر نماییم. این قابلیت ادراکی، باعث ایجاد انگیزه ای برای پدید آوردن یک زمینه مطالعاتی جدید گردید. هدف این زمینه مطالعاتی، طراحی سیستم های جداسازی گفتار بر اساس اصول سیستم شنوایی انسان است. در بسیاری از کاربردها نظیر بازشناسی گفتار اتوماتیک و مخابرات راه دور به یک سیستم موثر که توانایی جداسازی سیگنال گفتار هدف از سیگنال تداخلی را در شرایط تک میکروفونه داشته باشد، نیاز می باشد. بر این اساس در این رساله، سیستمی برای جداسازی سیگنال گفتار از تداخل در شرایط تک میکروفونه ارائه می نماییم. سیستم جداسازی گفتار تک میکروفونه پیشنهادی بر اساس ویژگی فرکانس گام در حوزه فرکانس مدولاسیون طراحی گردیده است. جداسازی بر اساس فیلتر نمودن سیگنال نویزی با استفاده از ماسک تخمین زده شده در حوزه طیف مدولاسیون با به کارگیری محدوده فرکانس گام تخمین زده شده، انجام می گیرد. برای بهبود عملکرد سیستم جداسازی پیشنهادی، یک سیستم جداسازی تک میکروفونه ترکیبی نیز پیشنهاد می گردد. در این سیستم، از فیلتر نمودن مدولاسیون همدوس وفقی برای جداسازی زیرباندهای با فرکانس پایین و از سیستم جداسازی تک میکروفونه ناهمدوس بازگشتی برای جداسازی زیرباندهای با فرکانس بالا استفاده می گردد. در فیلتر نمودن مدولاسیون همدوس وفقی، برای حذف سیگنال تداخلی از فیلتر وفقی affine projection استفاده می گردد که این فیلتر بر روی سیگنال مدولاتور بدست آمده از تبدیل مدولاسیون همدوس، اعمال می گردد. همچنین با به کارگیری یک میکروفون اضافه یک سیستم جداسازی دو میکروفونه بر اساس ویژگی های اختلاف زمانی برای زیرباندهای با فرکانس پایین و اختلاف چگالی برای زیرباندهای با فرکانس بالا، به منظور افزایش کیفیت سیگنال جدا شده پیشنهاد می نماییم. در سیستم دو میکروفونه پیشنهادی، جداسازی سیگنال هدف از تداخل بر مبنای ماسک باینری زمان- فرکانس تخمین زده شده بر اساس دو ویژگی مکانی اختلاف زمانی و اختلاف چگالی انجام می گیرد. نتایج ارزیابی نشان می دهد که سیستم های پیشنهادی تک میکروفونه در مقابل تداخل مقاوم است و در شرایطی که انرژی سیگنال تداخلی زیاد باشد نیز قادر به جداسازی گفتار هدف با کیفیت خوب می باشد. همچنین نتایج بدست آمده از سیستم جداسازی دومیکروفونه نشان دهنده جداسازی قسمت های واکدار و بی واک سیگنال گفتار هدف از سیگنال تداخلی با کیفیتی مورد قبول است.
زهرا امیری فر محمدرضا تابان
پردازش آرایه و متعاقب آن طراحی الگوریتم های مختلف جهت پردازش اطلاعات حاصل از آرایه ها مدت ها است که تحقیقات زیادی را به خود اختصاص داده است. اگر چه تاریخچه این تحقیقات به سالیان پیش بر می گردد اما مدتی است که به خاطر پیشرفت بشر در دستیابی به سرعت های بالای کلید زنی و پردازشگرهایی که قادرند در مدت زمانی اندک محاسبات زیادی را انجام دهند تحولات چشمگیری یافته است. البته هنوز هم این سرعت کافی نبوده و در بسیاری موارد باعث عدم پردازش مناسب داده ها می گردد. لازمه بررسی و تحلیل چنین مباحثی شناخت تکنیک آرایه ها و توانایی استفاده از الگوریتم های مناسب و مطابق با شرایط مسئله است. هدف از انجام این پایان نامه بررسی، ارزیابی و شبیه سازی انواع مختلف شکل دهنده پرتو است. در این پایان نامه بیش از 130 مقاله بررسی و 50 نوع الگوریتم معرفی شده است. با توجه به کاربرهای گسترده شکل دهی پرتو در تمام زمینه ها، سعی بر آن شده است که الگوریتم هایی که بیشتر در سونار کاربرد دارند بررسی گردد. در حالی که هریک از الگوریتم های مطرح شده جداگانه تحلیل و بررسی می شود؛ الگوریتم های جدیدی نیز ارائه و ارزیابی می شوند. در الگوریتم های جدید از یک روش نوین برای مقاوم کردن الگوریتم استفاده کرده ایم. در ادامه، شکل دهنده پرتو را بر اساس فیلتر کالمن توسعه یافته بررسی کرده و دو روش جدید برای پیاده سازی شکل دهنده پرتو ارائه و شبیه سازی می شود. الگوریتم های پیشنهادی را با فیلتر کالمن توسعه یافته ارزیابی می کنیم. در نهایت چندین روش در رابطه با کارهای بعدی پیشنهاد داده می شود.
احسان شاهزیدی حمیدرضا ابوطالبی
مکان یابی منبع گفتار در بسیاری از سیستم های پردازش گفتار از قبیل سیستم های تله کنفرانس، سیستم های بازشناسی گفتار، اتاق های کنفرانس هوشمند و سیستم های کمک شنوایی کاربرد دارد. مکان یابی منابع صوتی برای مشخص نمودن مکان دقیق یک یا چند منبع استفاده می شود که توسط روش های مختلفی انجام می گیرد. در این پایان نامه مکان یابی بر اساس آنالیز ویژه مدنظر است که اساس کار این روش ها، تجزیه ی ماتریس همبستگی میکروفون ها به فرم ویژه است. با تجزیه به فرم ویژه ی ماتریس همبستگی، بردار ویژه ها و مقادیر ویژه هایی بدست می آید که تشکیل دو زیر فضا (زیر فضای سیگنال و زیر فضای نویز) می دهند. در این پایان نامه نخست به بررسی روش های مختلف تخمین جهت منبع صوتی مبتنی بر آنالیز ویژه می پردازیم. نشان می دهیم روش های تخمین جهت منبع مبتنی بر توابع amdf وamsf در برابر روش های مبتنی بر همبستگی، حجم محاسباتی کمتر و دقت مناسبی دارند. در این تحقیق روش mamdf که از ترکیب توابع amdf و amsf بدست می آید را برای تخمین جهت منبع سیگنال نیز معرفی می کنیم و نشان می دهیم این تابع دقت بیشتری نسبت به بقیه روش های تخمین جهت منبع دارد. همچنین در نسبت سیگنال به نویزهای پایین با حذف نویز از بزرگترین مقدار ویژه اقدام به بهبود روش های تخمین جهت منبع می نمائیم. سپس به بررسی روش های تخمین تأخیر زمانی مبتنی بر آنالیز ویژه می پردازیم. با ترکیب اطلاعات حاصل از تخمین تأخیر زمانی بین جفت میکروفون ها، می توان به مکان دقیق منبع دست یافت. ضعف اکثر روش های تخمین تأخیر زمانی در شرایط نویزی است. با استفاده از بردار ویژه ی زیر فضای سیگنالی و حذف نویز در این زیر فضا، می توانیم در روش های تخمین تأخیر زمانی بهبود قابل توجهی ایجاد نماییم.
حامد قناعت پیشه حمیدرضا ابوطالبی
در این پژوهش به بررسی دو روش 1) مبتنی بر انرژی و 2) مبتنی بر تابع همدوسی میدان نویز پخشنده برای کالیبراسیون محل میکروفون ها در یک آرایه میکروفونی با ساختار ad-hoc پرداخته شده است. در مقایسه دو الگوریتم کالیبراسیون براساس انرژی می توان گفت که الگوریتم دوم دارای دو مزیت عمده نسبت به الگوریتم اول است؛ اول اینکه فرض یکسانی بودن موقعیت گوینده و لپ تاپش در نظر گرفته نشده است و موقعیت گوینده به طور جداگانه تخمین زده شده است؛ دوم اینکه الگوریتم دوم تخمین بهتری از موقعیت میکروفون ها را نسبت به الگوریتم اولی بدست می دهد. همچنین استحکام الگوریتم دوم در برابر خطای سنکرون سازی نسبت به الگوریتم اول نیز بیشتر است. روش کالیبراسیون برحسب انرژی مقاوم به نویز است ولی در برابر پژواک مقاوم نیست. همچنین این روش سرعت اجرای بسیار زیادی نسبت به روش مدل مبتنی بر همدوسی نویز پخشنده دارد. شبیه سازی ها نشان می دهد که با نزدیک شدن بیشتر میدان محیط به مدل نویز پخشنده دقت روش کالیبراسیون افزایش می یابد. همچنین دو روش فرم بسته و حل عددی برای تخمین فاصله میکروفون ها از گوینده بررسی شد. روش حل عددی به دلیل داشتن ماهیت تخمینی آن در بدست آوردن جواب در برابر پژواک و نویز مقاوم است. با این وجود، استفاده از روش های حل عددی باعث کاهش سرعت اجرا و افزایش بار محاسباتی می شود. برعکس، روش فرم بسته به دلیل استفاده از رابطه مستقیم برای بدست آوردن جواب سرعت بالایی دارد ولی نویز و پژواک شدیداً بر روی آن اثر می گذارد. همچنین به بررسی روش تعیین مکان گوینده در چیدمان میکروفونی ad-hoc نسبت به محل میکروفون ها (از دو روش فرم بسته و حل عددی) پرداختیم. در این فصل دو شیوه برای کاهش بار محاسباتی پیشنهاد شده است. استفاده از شیوه درون یابی در حل عددی سبب یافتن جواب با دقت بیشتر و همچنین کاهش بار محاسباتی شده است. دیگر پیشنهاد برای کاهش بار استفاده از روش پهنای بیشتر پنجره در تخمین tdoa توسط روش gcc-phat است. با این کار مقدار tdoa را می توان در شرایط محیط واقعی تخمین زد. با این وجود آزمایش ها نشان داده است که با افزایش میزان نویز و یا پژواک دقت روش نسبت به روش gcc-mphat کم می شود.
سیدحمید یزدانی حمیدرضا ابوطالبی
بهسازی گفتار یکی از شاخه های مهم پردازش گفتار است. امروزه با تنوع در کاربردهای پردازش گفتاری و وجود عوامل بسیار در تخریب سیگنال، امر بهسازی و بهبود کیفیت سیگنال گفتار از اهمیت زیادی برخوردار شده است. به عنوان یکی از روش های بهسازی (چندکاناله) گفتار، شکل دهی پرتو مطرح گردیده که با استفاده از آرایه های میکروفونی صورت می پذیرد. با توجه به محدودیت های موجود در نحوه چینش میکروفون ها، پنجره ای به سوی بحث آرایه های میکروفونی با چیدمان نامنظم (ad-hoc) گشوده شده است. هدف اصلی این پایان نامه، بررسی راهکارهایی برای شکل دهی پرتو در آرایه های میکروفونی ad-hoc است. با توجه به عدم شناخت نسبت به مکان و چینش میکروفون ها و همچنین پراکنده بودن میکروفون ها در محیط، ایده خوشه بندی میکروفون ها در این پایان نامه مورد بررسی قرار گرفته و برای میدان های نویزی متفاوت، روش های مختلفی برای خوشه بندی پیشنهاد شده است. برای حالت میدان نویزی پخشنده، توجه به تابع همدوسی میدان نویزی پخشنده و همچنین انرژی سیگنال های دریافتی از منابع مختلف، از پایه های روش پیشنهادی برای خوشه بندی است. در این حالت، با در نظر گرفتن مدل تابع همدوسی نویز پخشنده به عنوان معادله داده گوس-مارکف و استفاده از فیلتر کالمن، فاصله های بین میکروفونی تخمین زده شده و بر اساس این فاصله ها، خوشه بندی صورت می گیرد. برای حالت میدان نویزی جهتی (غیرپخشنده) نیز بر اساس انرژی منابع موجود در محیط روشی برای خوشه بندی پیشنهاد شده است. سعی شده روش خوشه بندی پیشنهادی برای شرایط نویز جهتی، برای تمامی میدان های نویزی قابل بکارگیری باشد. در ادامه، ساختار جدیدی برای شکل دهنده پرتو gsc نیز پیشنهاد شده که با دادن نقش مختلف به هریک از خوشه های میکروفونی، عملکرد سیستم بهسازی گفتار را ارتقا می بخشد. بررسی نتایج نشان می دهد که در بعضی از حالت ها، استفاده از یک خوشه در مقایسه با بهره گیری از تمام میکروفون ها نتیجه بهتری را به دنبال داشته که این خود، حاکی از دستاوردی اضافه در فرایند خوشه بندی است. این دستاورد، کاهش تعداد میکروفون های استفاده شده در بهسازی گفتار می باشد که منجر به کاهش پیچیدگی و حجم محاسبات (در عین افزایش کیفیت خروجی) می شود.
حامد دهقانپور فراشاه مسعودرضا آقابزرگی
وظیفه ی یک سیستم سونارِ پسیو، آشکارسازی، جهت یابی و تفکیک اهداف در محیط دریا می باشد. بهره گیری از خصوصیات طیفی به ویژه تونهای فرکانسی موجود در طیفِ سیگنال هدف یکی از راهکارهای دسته بندی اهداف می باشد. در این پژوهش پس ازمعرفی سونار پسیو، خصوصیات سیگنال شناور، نویز پس زمینه و ویژگیهای آن، چند روش مطرح در حذف نویز بر روی نمونه سیگنال هدف که صدای ضبط شده از پروانه یک شناور است پیادهسازی شده و تأثیر آنها بر بهبود دامنه تونهای فرکانسی نسبت به بخش پهن باند طیف و همچنین بهبود snr در سیگنال بهسازی شده تحلیل می شود. ابتدا به روش بهساز خط وفقی که یک روش وفقیِ مرسوم در بهسازی تونهای فرکانسیِ آمیخته با نویز پهن باند می باشد، پرداخته شده است. روش تخمین دامنه طیف کاربرد زیادی در بهسازی سیگنال گفتار دارد. با پیاده سازی چند الگوریتم مطرح تخمین دامنه طیف همچون تفریق دامنه و توان طیف، کارآیی چنین الگوریتمهایی در بهسازی سیگنال شناور که از نوع سیگنال آکوستیکی است مورد ارزیابی قرار گرفته است. شکل دهی پرتو بخش جدانشدنی از سامانه های سونار می باشد. با پیاده سازی روشهای مختلف شکل دهی پرتوی وفقی میزان بهبود حاصل شده در snr سیگنال خروجی اندازه گیری شده است. با دانستن و یا تخمین تابع همبستگیِ میدان نویزی می توان فیلتری در خروجیِ شکل دهنده ی پرتو طراحی کرد و snr را باز بهبود داد. این فیلتر که با عنوان پسافیلتر شناخته می شود به صورت گسترده در بهبود کیفیت گفتار به کار گرفته می شود. با شبیه سازی میدان نویزی همه جهته، پسافیلتر mccowan پیاده سازی و تأثیر آن بر طیف سیگنال شناور آمیخته با نویز بررسی شده است. روشهای ale و شکل دهی پرتوی وفقی استفاده زیادی در سیستمهای سونار پسیو دارند. شبیه سازی های انجام شده نشان داد استفاده از روشهای تخمین دامنه طیف و پسافیلتر نیز می تواند وضعیت تونهای فرکانسی را در طیف بهبود بخشد.
سعید غلامی نیا منصور رفیعیان
تحقیق حاضر به صورت تجربی و با همکاری "مجموعه کارخانجات تعمیرات لکوموتیو بافق" صورت گرفته و بر اساس نیاز این مجموعه تعریف شده است. در این پژوهش توانایی تحلیل ارتعاشی برای یافتن لاینر تَرَکدار لکوموتیوهای دیزل آلستوم مورد بحث و بررسی قرار گرفته است. هدف، ارائه روشی غیرمخرب، سریع و قابل اطمینان در ترک سنجی لاینرهای موتورهای لکوموتیو دیزل آلستوم است که بتواند جایگزین روش های سنتی و وقت گیر کنونی شود. از جمله فواید این جایگزینی، می توان کاهش زمان تعمیرات، کاهش هزینه های جاری و افزایش بهره وری را نام برد. شایان ذکر است که در صورت عدم تشخیص بهنگام و کامل شدن ترک لاینر، خرابی های جبران ناپذیری به بار خواهد آمد. این خرابی ها گاه تا به حدی است که موتور به طور کامل از رده خارج می شود. سیگنال های ارتعاشی با نصب حسگر شتاب سنج بر دیواره بیرونی موتور ثبت شده اند. از آنجایی که طبق بررسی ها و تحقیقات انجام شده، الگوی بروز این عیب تاکنون معرفی نشده است، کارایی روش های مختلف پردازش سیگنال در این موضوع مورد بحث و بررسی قرار داده شده اند. برای این مهم تعدادی از متداول ترین و کارآمدترین روش های پردازش سیگنال مورد استفاده در عیب یابی ماشین آلات در سه حوزه زمان، فرکانس و زمان- فرکانس مورد بحث و بررسی قرار گرفته اند. در حوزه زمان، پارامترهای جذر میانگین مربعات، کرتوسیس و فاکتور تاجی بررسی شده اند. این پارامترها نتوانستند نتایج مناسبی به دست دهند. در حوزه فرکانس، تبدیل فوریه سریع و در حوزه زمان- فرکانس، تبدیل های فوریه زمان- کوتاه، موجک و هیلبرت- هوانگ مورد بررسی قرار گرفته اند. نتایج حاصله، حاکی از کارآمدی تمامی این روش ها در تمیز دادن لاینر معیوب از سالم هستند. همچنین تمامی این روش ها به جز تبدیل موجک، در پایش پیش بینانه ترک لاینرها نیز بسیار مناسبند.
علی دهقان فیروزآبادی حمیدرضا ابوطالبی
هدف از این رساله، مکان یابی چند گوینده هم زمان از روی سیگنال های گفتار هم پوشانی دار گوینده ها است. روش های مبتنی بر تابع همبستگی متقابل تعمیم یافته (gcc) از مهم ترین روش های مطرح در این زمینه هستند. این روش ها در شرایط نامطلوب آکوستیکی دقت مناسبی نداشته و هم چنین نمی توانند گوینده های نزدیک به هم را به خوبی مکان یابی کنند. مشکل دیگر نیز، الیاسینگ فضایی در سیگنال های میکروفونی است که باعث تخریب اطلاعات ورودی سیستم می شود. محور کلی روش های پیشنهادی در این رساله، پردازش های زیرباندی برای بهره گیری از عدم هم پوشانی محتوای فرکانسی گفتار گویندگان مختلف است. در اولین روش پیشنهادی، سیگنال های میکروفونی نخست به باندهای مختلفی (به صورت یکنواخت) تقسیم بندی می شوند. سپس تابع gcc برای همه زوج میکروفون ها در همه زیرباندها محاسبه شده و نمودار هیستوگرام محل دو قلّه اول تابع gcc برای هر زیرباند بدست می آید. در ادامه، با استفاده از روش متوسط گیری وزن دار، این هیستوگرام ها ترکیب و از روی هیستوگرام نهایی، راستای دو گوینده ی همزمان تخمین زده می شود. هر چند این روش افزایش دقت مکان یابی را به دنبال دارد، ولی مسأله ی الیاسینگ فضایی و لزوم مشخص بودن تعداد گوینده، دو مشکل اصلی باقیمانده در این روش است. دوّمین روش پیشنهادیِ این رساله، هدف خود را بر روی تخمین تعداد گوینده و حذف الیاسینگ فضایی قرار می دهد. با استفاده از روش خوشه بندی k-means و اصل silhouette، روشی مبتنی بر پردازش های زیرباندی برای تخمین تعداد گوینده معرفی و سیستم مکان یابی به حالت بیش از دو گوینده تعمیم می یابد. سپس به منظور حذف الیاسینگ فضایی، آرایه میکروفونی دایره ای تودرتو پیشنهاد داده می شود که می تواند الیاسینگ فضایی را برای میکروفون های دور از هم حذف کند. علاوه بر این، با بهره گیری از یک بلوک تخمین نویز و استفاده وفقی از فیلترهای phat و ml، دقت سیستم در تخمین راستای گوینده در حضور نویز و انعکاس افزایش می یابد. در دو روش قبلی، فیلترهای استفاده شده بدون توجه به محتوای فرکانسی سیگنال گفتار اعمال می شود. در قسمت سوم رساله، استفاده از فیلترهای گاماتون را پیشنهاد می دهیم که متناسب با سیستم شنوایی انسان بوده و بر روی محتوای فرکانس پایین طیف سیگنال گفتار، قدرت تفکیک فرکانسی بالاتری دارند. ترکیب استفاده از این بانک فیلتر با روش زیرباند کردن با آرایه تودرتو، اگرچه حجم محاسبات را کمی بالا می برد ولی دقت تخمین های بدست آمده را تا حد مطلوبی افزایش می دهد. در ادامه برای کاهش بار محاسباتی، با تخمین طیف سیگنال گفتار از روش pwelch، فیلترهای گاماتون فقط بر روی نواحی پردامنه طیف گفتار بکار گرفته شده و سپس پردازش های زیرباندی با آرایه تودرتو بر روی خروجی فیلترهای گاماتون اعمال می شود. این اقدام ضمن حفظ دقت تخمین در حد روش قبلی، حجم محاسبات را تا حد خوبی کاهش می دهد. ارزیابی های این رساله بر روی سناریوهای مختلف محیطی اعم از انعکاسی، نویزی، و نویزی و انعکاسی توأم و هم چنین بر روی داده های واقعی و شبیه سازی و به ازای یک، دو و سه گوینده هم زمان انجام شده است. در ارزیابی های انجام شده، روش subband-gcc با روش های fullband و هم چنین subband-srp مقایسه شده است که برتری روش پیشنهادی را نشان می دهد. هم چنین در ادامه روش های پیشنهادی آرایه های تودرتو، فیلتر گاماتون و تخمین طیف نیز مورد ارزیابی و مقایسه قرار گرفته است که نتایج نشانگر برتری روش های پیشنهادی نسبت به روش های مرسوم می باشد.
صبا اسکندری دهکردی حمیدرضا ابوطالبی
مکان یابی منبع گفتار یکی از شاخه های مهم بحث پردازش گفتار می باشد. هدف روش های مکان یابی منابع، دستیابی به دقت بالاتر در مکان یابی می باشد. تلاش برای افزایش دقت، نوعاً افزایش حجم محاسبات را در پی خواهد داشت. در میان روش های مرسوم مکان یابی بر پایه tdoa (time difference of arrival) و srp (steered response power)، روش های مبتنی بر انرژی و جستجوی فضا دقت بالاتر را در کنار حجم بالای محاسباتی دارا هستند. در مقابل روش های مبتنی بر tdoa با حجم کم محاسبات ولی با دقت پایین مکان یابی را انجام می دهند. از طرفی در چند سال اخیر، استفاده از آرایه های نامنظم (یا ad-hoc) در مقایسه با آرایه های منظم توسعه بیشتری یافته است. هدف از این پایان نامه، معرفی یک روش مکان یابی در شبکه های میکروفونی با چیدمان ad-hoc است که ضمن حفظ دقت مکان یابی، حجم محاسباتی متناسبی نیز داشته باشد. دستیابی به این هدف، مستلزم استفاده از یک روش ترکیبی (ترکیب روشهای مبتنی بر انرژی و tdoa) است. روش پیشنهادی از سه گام تشکیل شده است. در گام اول بر اساس روش های مبتنی بر انرژی، و سپس استفاده از یکی از دو روش 1) جستجوی مستطیل های محدود کننده فضایی، و یا 2) دوایر متحدالمرکز، ناحیه محدودتری از فضا که منبع در آن واقع است، تخمین زده می شود. در گام دوم، tdoa بین جفت میکروفون های دو دسته از حسگرها که بیشترین انرژی را دارند، محاسبه، و در گام سوم با حداقل سازی یک تابع خطا، نقطه ای از فضا که ارضا کننده مقادیر بدست آمده برای tdoaهاست، به عنوان نتیجه مکان یابی بدست می آید. با آزمایش بر روی سناریوهای متفاوت و موقعیت های مختلف گوینده، کارایی بالای روش پیشنهادی در مقایسه با دو روش پایه tdoa و srp نشان داده شده است. در ادامه این تحقیق، از روش پیشنهادی برای مکان یابی منابع همزمان نیز استفاده گردیده و برتری کارایی آن در مقایسه با یکی از مهم ترین روش های مکان یابی منابع همزمان نشان داده شده است.
آسیه علی بیکی منشادی حمیدرضا ابوطالبی
با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی و وجود عوامل مخرب محیطی از جمله نویز، بهسازی گفتار از اهمیت زیادی برخوردار است. برای بهسازی گفتار روش های مختلفی وجود دارد که برخی مبتنی بر تخمین در حوزه زمان و برخی مبتنی بر تخمین در حوزه فرکانس هستند. روش های بهسازی گفتار را می توان به انواع روش های تک کاناله، آرایه میکروفونی و میکروفون های توزیع شده تقسیم کرد. ساختار میکروفونی توزیع شده ساختاری است که محدودیتی در چیدمان و محل قرار گیری میکروفون ها ندارد. هدف در این پایان نامه، ارائه روش هایی برای بهسازی گفتار با استفاده از روش های مبتنی بر طیف در سیستم چندکاناله توزیع شده است. برای بهسازی چندکاناله سیگنال گفتار، یک ایده کلی، تعمیم روش های تک کاناله بهسازی گفتار است. در این پایان نامه چند روش برای بهسازی چندکاناله سیگنال گفتار، ارائه شده که دو مورد از آنها بر اساس تعمیم روش های تک کاناله موجود است. تمامی این روش ها به نوعی بهبود یافته دو روش mstsa (تخمین چندکاناله دامنه طیف کوتاه مدت) و mlsa (تخمین چندکاناله لگاریتم دامنه طیف) هستند. در این پایان نامه با الهام گرفتن از روند طراحی روش om-lsa، با وارد کردن احتمال حضور گفتار در رابطه mlsa، روش om-mlsa را پیشنهاد داده ایم که عملکرد بهتری در مقایسه با mlsa دارد. همچنین تخمین مرتبه دامنه طیف ( -order stsa) را برای سیستم تک کاناله بررسی کرده و سپس با تعمیم آن به سیستم چندکاناله، روش -order mstsa را ارائه داده ایم. در ادامه، با وارد کردن ماتریس همبستگی بین فرکانسی در روابط mstsa و mlsa، دو تخمین زن imp-mstsa و imp-mlsa ارائه شده که بهبود قابل ملاحظه ای در عملکرد سیستم بهسازی گفتار چندکاناله ایجاد می کند.
فرهاد فغانی حمیدرضا ابوطالبی
چکیده ندارد.
جمال فلاحیان مهرجردی مسعودرضا آقابزرگی صحاف
چکیده ندارد.
مجید پوراحمدی حمیدرضا ابوطالبی
چکیده ندارد.
حسین مومن زاده حقیقی حمیدرضا ابوطالبی
چکیده ندارد.
آرش پیشرویان مسعودرضا آقابزرگی
چکیده ندارد.
هاجر مومنی محمدتقی صادقی
چکیده ندارد.
مرجان غلامرضایی مسعودرضا آقابزرگی
چکیده ندارد.
طاهره زارع بیدکی حمیدرضا ابوطالبی
نویز و انعکاس مهمترین عوامل محیطی موثر در تخریب سیگنال گفتار محسوب می شوند. هدف از این تحقیق بررسی یکی از پرکاربردترین ساختارهای بهسازی گفتار با نام حذف کننده لوب های فرعی (gsc) در مقابله با نویزهای جهت دار محیط است.به دنبال کاربردهای زیاد ساختار gsc برای حذف نویزهای جهت دار در حوزه سیگنال های باندباریک (همچون رادار، سونار و ...)، استفاده از این ساختار با هدف مقابله با نویزهای باندوسیع موجود بر روی سیگنال گفتار رایج شده است.در این پایان نامه، ضمن معرفی شکل دهنده های پرتو مقیّد از جمله lcmv و frost، هر یک از بلوک های ساختار gsc که تعمیمی از دو ساختار قبل است و بررسی نقش هر یک از این بلوک ها در حذف نویز پرداخته شده است. در ادامه نیز ساختارهای ترکیبی مرتبط با ساختار gsc برای کاربرد بهسازی سیگنال گفتار به همراه مقایسه نقاط ضعف و قوّت هر یک بررسی شده است.از آنجایی که اکثر سیگنال های نویز از طیف فرکانسی باندوسیع برخوردار هستند، شکل دهنده های پرتو باندباریک (از جمله ساختار gsc) نمی توانند نقش موثری در پاکسازی سیگنال گفتار از آن ها ایفا کنند. بر این اساس، با هدف ارتقای کیفیت بهسازی، ساختارهایی مانند شکل دهنده های پرتو مستقل از فرکانس (cdb) و ساختارهای زیرآرایه ای بررسی شده است. در ادامه، با تعمیم کارهای قبلی، ساختارهای ترکیبی cdb-gsc و cdgsc برای بهبود فرایند بهسازی سیگنال گفتار ارائه شده است.در پایان، به منظور ارزیابی ساختارهای پیشنهادی، به پیاده سازی آن ها و سنجش کارآیی آن ها بر روی دو دسته دادگان شبیه سازی شده و دادگان واقعی (ضبط شده در آزمایشگاه پردازش گفتار دانشگاه یزد) پرداخته شده است.نتایج حاصل از آزمایش های صورت گرفته روی سیگنال های گفتار (با طیف فرکانسی 400 تا 8000 هرتز) و منابع نویزی مختلف، بیانگر عملکرد مناسب ساختارهای پیشنهادی در بهسازی سیگنال گفتار و مقابله با نویزهای محیط است.
بهداد دشت بزرگ حمیدرضا ابوطالبی
با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته است که در همه این کاربردها وجود نویز و پژواک به عنوان عامل مخرب شناخته می شود. در طول چند دهه اخیر روش های متعددی برای حذف و کاهش پژواک ارائه شده که عمدتاً در دو دسته تک میکروفونه و چندمیکروفونه تقسیم می شود. در سیستم های تک میکروفونه نوعاً روش های طیفی کاهش پژواک مورد استفاده قرار می گیرد در حالی که در روش های مبتنی بر آرایه میکروفونی پردازش های مکانی مبنای کار می باشد. در این پایان نامه پس از بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز از جمله دو روش تخمین مرتبه متغیر mmse و omlsa، با ترکیب این دو، روش جدیدammse ارائه شده است. این روش دارای دو پارامتر مرتبه تخمین و احتمال شرطی حضور گفتار است. در ادامه، روش جدیدی برای محاسبه مرتبه تخمینammse ارائه داده ایم که بر خلاف روش های گذشته، این پارامتر را نه تنها برای هر فریم، بلکه برای هر مولفه فرکانسی به صورت جداگانه محاسبه می نماید. برای محاسبه مرتبه تخمین، رابطه ای خطی با احتمال شرطی حضور گفتار برای آن تعریف کرده و همچنین تأثیر انتخاب مقادیر منفی را برای این پارامتر بررسی نموده ایم. در ادامه، تعمیم روش پیشنهادی ammse در شرایط که پژواک حضور دارد، ارائه شده است و کارایی آن در محیط های واقعی که به طور همزمان دارای نویز و پژواک است مورد بررسی قرار گرفته است. در ادامه این پایان نامه، به ترکیب روش های پردازش مکانی و پردازش طیفی در سیستم های آرایه میکروفونی پرداخته و از میان پردازنده های مکانی، gsc و نمونه مناسب تر آن برای کاربرد حذف پژواک، یعنی tf-gsc را انتخاب کرده ایم. و با قرار دادن تخمین گر ammse در خروجی پردازنده های مکانی، دو ساختار ترکیبی جدید به نام های gsc-ammse وtf-gsc-ammse ارائه نموده ایم. نشان داده شده است که gsc-ammse کارایی چشمگیری در کاهش نویز دارد و روش tf-gsc-ammse نیز مقدار نویز و پژواک را به مقدار قابل توجهی کاهش می دهد.