نام پژوهشگر: حمیدرضا ابوطالبی

بهبود عملکرد سیستم های مکان یابی منبع گفتار در محیط های واقعی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
  علی دهقان فیروزآبادی   حمیدرضا ابوطالبی

مکان یابی منبع گفتار یکی از زیر شاخه های سیستم های پردازش گفتاری می باشد. در این پژوهش مکان یابی منبع گفتار با استفاده از روش های مبتنی بر srp مدنظر بوده است. روش استفاده شده در این پژوهش روش srp-phat است. روش srp-phat در مکان یابی منبع گفتار تحت شرایط انعکاسی، مقاوم می باشد. در حقیقت این روش که بر مبنای شکل دهی پرتو آرایه میکروفونی بنا نهاده شده است، سعی می کند با جستجوی فضا، ماکزیمم انرژی در فضا را پیدا کند. به همین منظور این روش برای مکان یابی نیازمند جستجوی کامل فضا می باشد. این امر باعث می شود که روش srp-phat حجم محاسبات بالایی را به خود اختصاص بدهد. روش های مختلفی از جمله src و cfrc برای کاهش حجم محاسبات معرفی شده اند که سعی می کنند طی یک فرآیند تکرار شونده، فضای جستجو را کوچک و کوچک تر کرده تا به مکان منبع منتهی شود. در این پژوهش روش srp-phat و روش های کاهش حجم محاسبات src و cfrc تحت سه سناریوهای مختلف شبیه سازی شده است: محیط نویزی، محیط انعکاسی و محیط نویزی و انعکاسی توأم. همچنین آزمایش ها برای سه موقعیت مختلف گوینده، انجام شده است: گوینده جلوی آرایه، گوینده در کنار آرایه و گوینده در گوشه ی اتاق. در ادامه روش هایی برای کاهش بیشتر حجم محاسبات و افزایش دقت روش srp-phat ارائه شد. روش جستجوی فضا بر مبنای تخمین doa و فضای قطاع بندی شده از روش هایی بود که در این پژوهش مطرح گردید. نشان داده شد که این روش حجم محاسبات را به مقدار قابل توجهی کاهش داده و همچنین باعث افزایش دقت روش srp-phat می شود. در ادامه دو شکل آرایه ای جدید پیشنهاد شد که باعث افزایش دقت سیستم مکان یابی منبع گفتار شدند. در انتها نیز روش جدید مکان یابی srp-ml پیشنهاد شده است که در شرایط نویزی و نیز نویزی و انعکاسی توأم، دقت به مراتب بالاتری را نسبت به روش srp-phat دارا می باشد. دقت این روش در شرایط انعکاسی کمی بدتر از روش srp-phat است.

تخمین زاویه ورود سیگنال با استفاده از پردازش سیگنال آنتن های آرایه ای
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
  محمدرضا جعفرپوربغدادآباد   عباسعلی حیدری

تخمین فاصله و زاویه ی مسیر سیگنال دریافتی منابع با استفاده از آنتن‏های آرایه‏ای در دو دهه ی اخیر مورد توجه ویژه قرار گرفته و موضوع پژوهش‏های بسیاری بوده است. در این پایان نامه تعدادی از روش‏های تخمین زاویه ی ورود منابع سیگنال باند باریک و همچنین برخی روش‏های تخمین تعداد منابع سیگنال بررسی و شبیه‏سازی شده و با یکدیگر مقایسه شده اند. تکنیک های زیادی برای تخمین زاویه ی ورود منابع ارائه شده‏اند. از جمله روش‏های موجود برای تخمین زاویه ی ورود می‏توان روش‏های مبتنی بر جهت دهی پرتو، روش های مبتنی بر زیر فضا و همچنین روش هایی که از معیار حداکثر درست نمایی استفاده می نمایند، را نام برد. معمولاً همراه با روش‏های تخمین جهت منابع، از روش‏های تخمین تعداد منابع مانند mdl و aic هم استفاده می شود، این روش ها از تئوری اطلاعات استفاده می کنند. در این پایان نامه برای بالا بردن دقت تخمین و قدرت تفکیک زاویه ی ورود، روشی جدید با استفاده از تفاضل مرتبه دوم ارائه گردیده است که با محاسبه ی تفاضل مرتبه دوم از طیف روش های زیرفضا و جهت دهی پرتو، دقت الگوریتم ها در تشخیص زوایای نزدیک را بهبود می دهد. بدین ترتیب خطای تخمین زاویه ورود به‏طور چشمگیری کاهش می‏یابد. همچنین روش دیگری بر مبنای تجزیه ماتریس کوواریانس داده های خروجی آرایه، پیشنهاد شده است که بدون نیاز به تعداد منابع می تواند راستای ورود سیگنال ها را محاسبه کند، دقت این روش از الگوریتم های زیرفضا کمتر است، ولی مزیت آن این است که به صورت کور راستای ورود سیگنال ها را پیدا می کند. در نهایت نتایج شبیه‏سازی روش‏های بیان شده، ارائه شده است.

بهبود کیفیت سرویس در ارتباطات بی سیم بوسیله آنتن های هوشمند
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
  کوکب کجباف زاده   عباسعلی حیدری

در این پایان نامه آنتن هوشمند به عنوان وسیله ای در جهت بهبود کیفیت سیستم های مخابرات بی سیم مورد بررسی قرار گرفته است. ابتدا به معرفی انواع آنتن های هوشمند پرداخته و نحوه ی عملکرد آنها شرح داده شده است. از آنجایی که آنتن های وفقی گروه مهمی از آنتن های هوشمند هستند و امروزه بیش از پیش مورد توجه قرار گرفته اند در ابتدا چند الگوریتم وفقی متداول معرفی شده و سپس با انجام شبیه سازی، سه الگوریتم کاربردی در زمینه آنتن هوشمند مورد مقایسه قرار داده و مشاهده شده است که الگوریتم lms از دو الگوریتم rls و dmi کندتر است و حجم محاسبات کمتری دارد و در عوض بسیار ساده تر است. الگوریتم rls سریعتر از الگوریتم lms همگرا می شود و الگوریتم dmi از دو الگوریتم دیگر سریعتر عمل می کند ولی به دلیل نیاز به محاسبه ماتریس معکوس در هر مرحله، نیاز به پردازشگر قوی دارد. همچنین عملکردالگوریتم dmi به ازای بلوکهای مختلف تخمین ماتریس همبستگی مورد بررسی و شبیه سازی قرار گرفته است. در نهایت با مقایسه بهبود نرخ خطای بیت در گیرنده با استفاده از هر کدام از الگوریتم ها، مشاهده شده است که بهبود نرخ خطای بیت با استفاده از الگوریتم dmi بیشتر است. در ادامه به کمک الگوریتم ژنتیک چند آرایه دایره ای هم مرکز به گونه ای بهینه سازی شده است که سطح پرتوهای کناری تا حد امکان کوچک شود. با انجام این کار به دلیل کاهش سیگنالهای تداخل در سیستم مخابرات بی سیم، نرخ خطای بیت کاهش یافته و ظرفیت سیستم افزایش می یابد. به عنوان نمونه برای آرایه دایره ای هم مرکز که در دایره داخلی 5 المان و در دایره خارجی 7 المان دارد، سطح پرتوی کناری با استفاده از الگوریتم ژنتیک نسبت به آرایه با فاصله بین المانی نصف طول موج، حدود 4/4 دسی بل کاهش یافته است. در انتها، روشی برای محاسبه ظرفیت یک سلول ایزوله با استفاده از آنتن هوشمند در مقایسه با آنتن همه جهته ارائه شده و از طریق شبیه سازی الگوی تابش آرایه خطی یکنواخت و آرایه دایره ای یکنواخت، بهبود ظرفیت سیستم برای این دو آرایه مورد ارزیابی قرار گرفته است .

بهسازی گفتار با استفاده از شکل دهنده پرتو فوق جهتی و پسافیلتر
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  پریناز خیری   حمیدرضا ابوطالبی

در این پایان نامه برای بهسازی گفتار با استفاده از آرایه میکروفونی، از شکل دهنده پرتو و به دنبال آن از یک پسافیلتر استفاده شده است. برای این منظور بر روی شکل دهنده پرتو فوق جهتی، در دو حوزه پردازشی میدان-دور و میدان-نزدیک تمرکز شده است. از آن جا که گفتار سیگنالی باندوسیع است، برای بهبود عملکرد سیستم، شکل دهنده پرتو فوق جهتی به صورت زیر آرایه ای، پیاده سازی گردیده است. در ادامه، با ترکیب شکل دهنده پرتو فوق جهتی با ساختار generalized sidelobe canceller کارایی ساختار، به ویژه در حذف نویزهای جهتی ارتقاء یافته است. برای این منظور در یک آزمایش از یک آرایه میکروفونی lشکل و با استفاده از gsc، ساختار gsc-sdb ارزیابی شده و در آزمایشی دیگر با استفاده از lcmv به جای blocking matrix، ساختارgsc-sdb برای زوایای دید دلخواه تعمیم داده شده است. سپس این ایده برای شرایط میدان-نزدیک نیز ارزیابی شده است. به منظور بهبود عملکرد سیستم چندکاناله، در خروجی شکل دهنده پرتو از پسافیلتر استفاده شده است. برای این منظور، پسافیلترهای تک کاناله و چندکاناله مورد توجه قرار گرفته است. در ادامه عملکرد پسافیلتر mccowan در محیط های نویزی واقعی، با بدست آوردن تابع همدوسی از سیگنال های ورودی آرایه به نحو قابل توجهی بهبود داده شده است. همچنین با بکارگیری الگوریتمی مشابه mccowan بر روی پسافیلتر stsa(short time spectral amplitude)، تغییرات عملکرد این پسافیلتر در شبیه سازی بررسی شده است. در نهایت ایده استفاده از پسافیلتری با ترکیب پسافیلترهای چندکاناله و تک کاناله و برای مرتفع کردن نارسایی های این ایده از پسافیلتر زیرباندی که در آن برای هر زیرباند از پسافیلتری مناسب آن زیرباند استفاده می شود، ارائه شده و عملکرد مناسب آن مشاهده گردیده است.

مکان یابی چند گوینده همزمان
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  هدیه هلی   حمیدرضا ابوطالبی

مکان یابی منبع گفتار در بسیاری از سیستم های پردازش گفتار از قبیل سیستم های تله کنفرانس، سیستم های بازشناسی صوت، اتاق های کنفرانس هوشمند و سیستم های کمک شنوایی کاربرد دارد. امروزه مکان یابی منبع صوت با کمک آرایه های میکروفونی از موضوعات مورد توجه می باشد. این آرایه ها در نهایت سیگنال دارای کیفیت مطلوب را از منبع صوتی تهیه می کنند و منابع صوتی غیر دلخواه را حذف می کنند. اما یکی از چالش های پیش رو در کاربردهای ذکر شده، بحث مکان یابی چند گوینده همزمان است. در این پایان نامه به بررسی یکی از روش های مکان یابی چندین گوینده همزمان که بر اساس الگوریتم های جداسازی کور منابع (bss) است، می پردازیم. bss را می توان به صورت مجموعه ای از شکل دهنده های پرتو صفر و تطبیقی کور درنظر گرفت. در حقیقت در حالی که برای یافتن مکان منابع، به اطلاعاتی در مورد مکان منابع نیاز داریم تا شکل دهنده پرتو را به سمت آن ها هدایت کنیم، bss بدون داشتن این اطلاعات اولیه، امکان بازیابی سیگنال ها را از سیگنال های ضبط شده در میکروفون ها -که ترکیبی از سیگنال های همزمان هستند- فراهم می کند. این به آن معناست که فیلترهای جداکننده bss حاوی اطلاعات مهمی در مورد مکان منابع هستند. در نهایت با توجه به فیلترهای جداکننده حاصل از الگوریتم bss، می توان الگوی تشعشعی بدست آورد که با یافتن مینیمم ها در این الگو، قادر به تخمین مکان منابع هستیم. در این پایان نامه به منظور بهبود عملکرد الگوریتم مکان یابی در محیط های انعکاسی، روشی پیشنهاد کردیم که در آن تنها بزرگترین ضریب فیلترهای جداکننده که متناظر با مسیر مستقیم است را درنظر گرفته و الگوی تشعشعی را محاسبه می کنیم. همچنین برای کاهش بار محاسباتی، محدوده فرکانسی موردنظر برای فرآیند متوسط گیری را کاهش می دهیم. نتایج شبیه سازی گویای دقت بالاتر الگوریتم پیشنهادی در تخمین مکان منابع همزمان نسبت به روش های مشابه می باشد

بررسی میزان تنکی سیگنال گفتار به منظور کاربرد در بهسازی گفتار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  الهام امامی میبدی   حمیدرضا ابوطالبی

نمایش های تُنُک، ابزار قدرتمندی را در آنالیز و پردازش سیگنال های گفتار و صوت ایجاد کرده اند و تنکی به صورت یک مفهوم کلیدی و مهم در زمینه های مختلفی چون جداسازی کور منابع، فشرده سازی، نمونه برداری و آنالیز سیگنال در آمده است. هدف از این پایان نامه، بررسی تنکیِ سیگنال گفتار در حوزه های مختلف و استفاده از نتایجِ این بررسی در مسأله ی بهسازی گفتار است. با توجه به اینکه در کاربردهای مختلف، تعابیر متفاوتی از تنکی وجود دارد، از این رو ابتدا به بررسی و تشریحِ مفاهیم و اصول کلیِ تنکی یک سیگنال می پردازیم. در این راستا شش ویژگی را برای یک معیار تنکی بیان کرده و این شش ویژگی را مبنای مقایسه ی معیارهای مطرح در زمینه ی تنکی قرار می دهیم. با بررسی هایی که انجام می دهیم، سه معیارِ gini، hoyer و kurtosis به عنوان معیارهای کارا و مناسب در سنجش میزانِ تنکی انتخاب می کنیم. نتایج حاصل از اعمال این سه معیار به سیگنال های گفتار در حوزه های مختلف (شامل حوزه ی زمان، dct، mdct، stft، dwt، gabor، mclt)، تبدیل های dct و mdct را به عنوان حوزه هایی که تنک ترین نمایش از سیگنال گفتار را موجب می شوند، معرفی می نماید. همچنین نشان داده می شود که تبدیل dct در مقایسه با تبدیل mdct خطای کمتری را در بازسازی دارد. در ادامه ی این تحقیق، موضوعِ بهسازی گفتار در تنک ترین حوزه (حوزه یِ dct) بر اساس ویژگی های سیگنال گفتار مورد بررسی قرار گرفته است. بدین منظور پس از بررسی روش های کلاسیک آستانه گذاری در حوزه ی dct و مزایا و معایب آنها، یک الگوریتم آستانه گذاری بر اساس واکداری یا بی واکی هر فریم پیشنهاد و پیاده سازی گردیده و عملکرد آن در مواجهه با سیگنال گفتار نویزی (در شرایط مختلف) مورد ارزیابی قرار گرفته است.

توسعه روشهای مبتنی بر فرض توزیع غیرگوسی برای بهسازی گفتار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1391
  محبوبه کارگریان مروستی   حمیدرضا ابوطالبی

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین دامنه طیف سیگنال گفتار و هم چنین تخمین ضرایب حقیقی و موهومی طیف گفتار مبتنی بر معیار mmse و map و با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار ارائه شده اند. در سال های اخیر محققان به دنبال واردکردن مدل های احتمالاتی دقیق تری برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند . در این پایان نامه، ابتدا به بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار و هم چنین سیستم تک کاناله تخمین مولفه های دکارتی ضرایب سیگنال تمیز با همان فرض گوسی بودن ضرایب می پردازیم . در ادامه نگاهی به سیستم های بهسازی که مبتنی برفرض غیرگوسی برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند، داریم . در این زمینه، نخست به کمک معیار kullback به دنبال تابع توزیعی هستیم که بر هیستوگرام دامنه گفتار منطبق شود . در این راستا با استفاده از توزیع سوپرگوسین و با تغییر پارامترهایش از نظر معیار kullback به توزیع نمایی رسیدیم که بر هیستوگرام دامنه گفتار منطبق تر است و تخمین گر دامنه طیف سیگنال گفتار را با فرض توزیع نمایی برای دامنه گفتار براساس معیار mmse بدست آوردیم . در ادامه این پایان نامه ، روش تخمین مرتبه متغیر mmse با فرض سوپرگوسین بودن دامنه گفتار را مورد بازنگری قرار داده و تخمین گرهای جدید را استخراج می کنیم. شبیه سازی ها نشان می دهند که با در نطرگرفتن توزیع نمایی برای دامنه گفتار نسبت به حالتی که ضرایب توزیع لاپلاس یا گوسی دارند بهسازی بیشتری از نظر معیار segsnr بدست می آید .

استفاده از روش های جداسازی کور منابع در مکانیابی چند منبع صوتی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1391
  مهدی آزادی   حمیدرضا ابوطالبی

تخمین مقادیر tdoa (time differential of arrival) یکی از روش های پایه ای در مکان یابی منابع گفتار می باشد که به طور وسیع مورد بررسی قرار گرفته است. در دهه ی اخیر تحقیقات زیادی بر روی تخمین مقادیر tdoa با استفاده از فیلترهای بازترکیب مستخرج از جداسازی کور منابع، صورت گرفته است. در این پژوهش ضمن معرفی چندین روش از روش های مطرح شده در سال های اخیر، به بررسی و پیاده سازی روش sct (state coherence transform) پرداخته و نقاط ضعف و قوت آن را بررسی می کنیم. در ادامه ضمن معرفی مشکل الیاسینگ فضایی که در صورت عدم رعایت نرخ نمونه برداری مکانی مناسب توسط میکروفون ها بوجود می آید، روش msct (modified sct) برای بهبود عملکرد مکان یابی در فواصل میکروفونی زیاد و کاهش اثر الیاسینگ فضایی پیشنهاد می شود که خطای مکان یابی در فاصله ی میکروفونی l=1m را 1/74% کاهش می دهد. با توجه به کاهش دقت عملکرد روش msct در شرایط نویزی، با وزن دهی روش msct که آن را wsct (weighted sct) می نامیم، خطای مکان یابی در محیط های نویزی با snr=5db را به میزان 89/82% کاهش می دهیم. در ادامه، با توجه به روند کاهشی دقت تخمین مقادیر tdoa با استفاده از روش های فوق در محیط های پژواکی، روش cc-bss (cross correlation blind source separation) با استفاده از همبستگی متقابل درایه های فیلتر بازترکیب مستخرج از bss، معرفی می شود که در محیط با زمان انعکاس 700میلی ثانیه خطای sct را به میزان 21/34% کاهش می دهد. سپس با پیاده سازی این روش در حوزه ی فرکانس و وزن دهی آن، روش gcc-bss (generalized cc-bss) معرفی می شود که در آن از دو فیلتر گوسی و phat (phase transform) برای وزن دهی استفاده می کنیم که روش gcc-bss-phat در محیط با زمان انعکاس 700میلی ثانیه خطای مکان یابی با استفاده از روش cc-bss را به میزان 66/41% کاهش می دهد. کلمات کلیدی: مکان یابی، tdoa، جداسازی کور منابع، الیاسینگ فضایی، فیلتر phat

توسعه روش های مبتنی بر ویژگی برای جداسازی گفتار دو گوینده همزمان
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1391
  آذر محمودزاده   حمید سلطانیان زاده

در یک مهمانی، ما می توانیم به یک صدای خاص توجه ویژه داشته باشیم و دیگر صداهای تداخلی موجود در محیط اطراف خود را فیلتر نماییم. این قابلیت ادراکی، باعث ایجاد انگیزه ای برای پدید آوردن یک زمینه مطالعاتی جدید گردید. هدف این زمینه مطالعاتی، طراحی سیستم های جداسازی گفتار بر اساس اصول سیستم شنوایی انسان است. در بسیاری از کاربردها نظیر بازشناسی گفتار اتوماتیک و مخابرات راه دور به یک سیستم موثر که توانایی جداسازی سیگنال گفتار هدف از سیگنال تداخلی را در شرایط تک میکروفونه داشته باشد، نیاز می باشد. بر این اساس در این رساله، سیستمی برای جداسازی سیگنال گفتار از تداخل در شرایط تک میکروفونه ارائه می نماییم. سیستم جداسازی گفتار تک میکروفونه پیشنهادی بر اساس ویژگی فرکانس گام در حوزه فرکانس مدولاسیون طراحی گردیده است. جداسازی بر اساس فیلتر نمودن سیگنال نویزی با استفاده از ماسک تخمین زده شده در حوزه طیف مدولاسیون با به کارگیری محدوده فرکانس گام تخمین زده شده، انجام می گیرد. برای بهبود عملکرد سیستم جداسازی پیشنهادی، یک سیستم جداسازی تک میکروفونه ترکیبی نیز پیشنهاد می گردد. در این سیستم، از فیلتر نمودن مدولاسیون همدوس وفقی برای جداسازی زیرباندهای با فرکانس پایین و از سیستم جداسازی تک میکروفونه ناهمدوس بازگشتی برای جداسازی زیرباندهای با فرکانس بالا استفاده می گردد. در فیلتر نمودن مدولاسیون همدوس وفقی، برای حذف سیگنال تداخلی از فیلتر وفقی affine projection استفاده می گردد که این فیلتر بر روی سیگنال مدولاتور بدست آمده از تبدیل مدولاسیون همدوس، اعمال می گردد. همچنین با به کارگیری یک میکروفون اضافه یک سیستم جداسازی دو میکروفونه بر اساس ویژگی های اختلاف زمانی برای زیرباندهای با فرکانس پایین و اختلاف چگالی برای زیرباندهای با فرکانس بالا، به منظور افزایش کیفیت سیگنال جدا شده پیشنهاد می نماییم. در سیستم دو میکروفونه پیشنهادی، جداسازی سیگنال هدف از تداخل بر مبنای ماسک باینری زمان- فرکانس تخمین زده شده بر اساس دو ویژگی مکانی اختلاف زمانی و اختلاف چگالی انجام می گیرد. نتایج ارزیابی نشان می دهد که سیستم های پیشنهادی تک میکروفونه در مقابل تداخل مقاوم است و در شرایطی که انرژی سیگنال تداخلی زیاد باشد نیز قادر به جداسازی گفتار هدف با کیفیت خوب می باشد. همچنین نتایج بدست آمده از سیستم جداسازی دومیکروفونه نشان دهنده جداسازی قسمت های واکدار و بی واک سیگنال گفتار هدف از سیگنال تداخلی با کیفیتی مورد قبول است.

بررسی و ارزیابی الگوریتم های شکل دهی پرتو در سیستم های سونار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392
  زهرا امیری فر   محمدرضا تابان

پردازش آرایه و متعاقب آن طراحی الگوریتم های مختلف جهت پردازش اطلاعات حاصل از آرایه ها مدت ها است که تحقیقات زیادی را به خود اختصاص داده است.‎ اگر چه تاریخچه این تحقیقات به سالیان پیش بر می گردد اما مدتی است که به خاطر پیشرفت بشر در دستیابی به سرعت های بالای کلید زنی و پردازشگرهایی که قادرند در مدت زمانی اندک محاسبات زیادی را انجام دهند تحولات چشمگیری یافته است. البته هنوز هم این سرعت کافی نبوده و در بسیاری موارد باعث عدم پردازش مناسب داده ها می گردد‎.‎ لازمه بررسی و تحلیل چنین مباحثی شناخت تکنیک آرایه ها و توانایی استفاده از الگوریتم های مناسب و مطابق با شرایط مسئله است. هدف از انجام این پایان نامه بررسی‏، ارزیابی و شبیه سازی انواع مختلف شکل دهنده پرتو است. در این پایان نامه بیش از 130 مقاله بررسی و 50 نوع الگوریتم معرفی شده است. با توجه به کاربرهای گسترده شکل دهی پرتو‏ در تمام زمینه ها‏، سعی بر آن شده است که الگوریتم هایی که بیشتر در سونار کاربرد دارند بررسی گردد.‎ ‎ در حالی که هریک از الگوریتم های مطرح شده جداگانه تحلیل و بررسی می شود؛ الگوریتم های جدیدی نیز ارائه و ارزیابی می شوند. در الگوریتم های جدید از یک روش نوین برای مقاوم کردن الگوریتم استفاده کرده ایم. در ادامه‏، شکل دهنده پرتو را بر اساس فیلتر کالمن توسعه یافته بررسی کرده و دو روش جدید برای پیاده سازی شکل دهنده پرتو ارائه و‎ شبیه سازی می شود. الگوریتم های پیشنهادی را با فیلتر کالمن توسعه یافته ارزیابی می کنیم. در نهایت چندین روش در رابطه با کارهای بعدی پیشنهاد داده می شود.

مکان یابی منابع صوتی با رویکرد آنالیز مقادیر ویژه
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1392
  احسان شاهزیدی   حمیدرضا ابوطالبی

مکان یابی منبع گفتار در بسیاری از سیستم های پردازش گفتار از قبیل سیستم های تله کنفرانس، سیستم های بازشناسی گفتار، اتاق های کنفرانس هوشمند و سیستم های کمک شنوایی کاربرد دارد. مکان یابی منابع صوتی برای مشخص نمودن مکان دقیق یک یا چند منبع استفاده می شود که توسط روش های مختلفی انجام می گیرد. در این پایان نامه مکان یابی بر اساس آنالیز ویژه مدنظر است که اساس کار این روش ها، تجزیه ی ماتریس همبستگی میکروفون ها به فرم ویژه است. با تجزیه به فرم ویژه ی ماتریس همبستگی، بردار ویژه ها و مقادیر ویژه هایی بدست می آید که تشکیل دو زیر فضا (زیر فضای سیگنال و زیر فضای نویز) می دهند. در این پایان نامه نخست به بررسی روش های مختلف تخمین جهت منبع صوتی مبتنی بر آنالیز ویژه می پردازیم. نشان می دهیم روش های تخمین جهت منبع مبتنی بر توابع amdf وamsf در برابر روش های مبتنی بر همبستگی، حجم محاسباتی کمتر و دقت مناسبی دارند. در این تحقیق روش mamdf که از ترکیب توابع amdf و amsf بدست می آید را برای تخمین جهت منبع سیگنال نیز معرفی می کنیم و نشان می دهیم این تابع دقت بیشتری نسبت به بقیه روش های تخمین جهت منبع دارد. همچنین در نسبت سیگنال به نویزهای پایین با حذف نویز از بزرگترین مقدار ویژه اقدام به بهبود روش های تخمین جهت منبع می نمائیم. سپس به بررسی روش های تخمین تأخیر زمانی مبتنی بر آنالیز ویژه می پردازیم. با ترکیب اطلاعات حاصل از تخمین تأخیر زمانی بین جفت میکروفون ها، می توان به مکان دقیق منبع دست یافت. ضعف اکثر روش های تخمین تأخیر زمانی در شرایط نویزی است. با استفاده از بردار ویژه ی زیر فضای سیگنالی و حذف نویز در این زیر فضا، می توانیم در روش های تخمین تأخیر زمانی بهبود قابل توجهی ایجاد نماییم.

مکان یابی منبع صوت با استفاده از شبکه های حسگر صوتی ad-hoc
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392
  حامد قناعت پیشه   حمیدرضا ابوطالبی

در این پژوهش به بررسی دو روش 1) مبتنی بر انرژی و 2) مبتنی بر تابع همدوسی میدان نویز پخشنده برای کالیبراسیون محل میکروفون ها در یک آرایه میکروفونی با ساختار ad-hoc پرداخته شده است. در مقایسه دو الگوریتم کالیبراسیون براساس انرژی می توان گفت که الگوریتم دوم دارای دو مزیت عمده نسبت به الگوریتم اول است؛ اول اینکه فرض یکسانی بودن موقعیت گوینده و لپ تاپش در نظر گرفته نشده است و موقعیت گوینده به طور جداگانه تخمین زده شده است؛ دوم اینکه الگوریتم دوم تخمین بهتری از موقعیت میکروفون ها را نسبت به الگوریتم اولی بدست می دهد. همچنین استحکام الگوریتم دوم در برابر خطای سنکرون سازی نسبت به الگوریتم اول نیز بیشتر است. روش کالیبراسیون برحسب انرژی مقاوم به نویز است ولی در برابر پژواک مقاوم نیست. همچنین این روش سرعت اجرای بسیار زیادی نسبت به روش مدل مبتنی بر همدوسی نویز پخشنده دارد. شبیه سازی ها نشان می دهد که با نزدیک شدن بیشتر میدان محیط به مدل نویز پخشنده دقت روش کالیبراسیون افزایش می یابد. همچنین دو روش فرم بسته و حل عددی برای تخمین فاصله میکروفون ها از گوینده بررسی شد. روش حل عددی به دلیل داشتن ماهیت تخمینی آن در بدست آوردن جواب در برابر پژواک و نویز مقاوم است. با این وجود، استفاده از روش های حل عددی باعث کاهش سرعت اجرا و افزایش بار محاسباتی می شود. برعکس، روش فرم بسته به دلیل استفاده از رابطه مستقیم برای بدست آوردن جواب سرعت بالایی دارد ولی نویز و پژواک شدیداً بر روی آن اثر می گذارد. همچنین به بررسی روش تعیین مکان گوینده در چیدمان میکروفونی ad-hoc نسبت به محل میکروفون ها (از دو روش فرم بسته و حل عددی) پرداختیم. در این فصل دو شیوه برای کاهش بار محاسباتی پیشنهاد شده است. استفاده از شیوه درون یابی در حل عددی سبب یافتن جواب با دقت بیشتر و همچنین کاهش بار محاسباتی شده است. دیگر پیشنهاد برای کاهش بار استفاده از روش پهنای بیشتر پنجره در تخمین tdoa توسط روش gcc-phat است. با این کار مقدار tdoa را می توان در شرایط محیط واقعی تخمین زد. با این وجود آزمایش ها نشان داده است که با افزایش میزان نویز و یا پژواک دقت روش نسبت به روش gcc-mphat کم می شود.

شکل دهی پرتو در شبکه های حسگر صوتی ad-hoc
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1392
  سیدحمید یزدانی   حمیدرضا ابوطالبی

بهسازی گفتار یکی از شاخه های مهم پردازش گفتار است. امروزه با تنوع در کاربردهای پردازش گفتاری و وجود عوامل بسیار در تخریب سیگنال، امر بهسازی و بهبود کیفیت سیگنال گفتار از اهمیت زیادی برخوردار شده است. به عنوان یکی از روش های بهسازی (چندکاناله) گفتار، شکل دهی پرتو مطرح گردیده که با استفاده از آرایه های میکروفونی صورت می پذیرد. با توجه به محدودیت های موجود در نحوه چینش میکروفون ها، پنجره ای به سوی بحث آرایه های میکروفونی با چیدمان نامنظم (ad-hoc) گشوده شده است. هدف اصلی این پایان نامه، بررسی راهکارهایی برای شکل دهی پرتو در آرایه های میکروفونی ad-hoc است. با توجه به عدم شناخت نسبت به مکان و چینش میکروفون ها و همچنین پراکنده بودن میکروفون ها در محیط، ایده خوشه بندی میکروفون ها در این پایان نامه مورد بررسی قرار گرفته و برای میدان های نویزی متفاوت، روش های مختلفی برای خوشه بندی پیشنهاد شده است. برای حالت میدان نویزی پخشنده، توجه به تابع همدوسی میدان نویزی پخشنده و همچنین انرژی سیگنال های دریافتی از منابع مختلف، از پایه های روش پیشنهادی برای خوشه بندی است. در این حالت، با در نظر گرفتن مدل تابع همدوسی نویز پخشنده به عنوان معادله داده گوس-مارکف و استفاده از فیلتر کالمن، فاصله های بین میکروفونی تخمین زده شده و بر اساس این فاصله ها، خوشه بندی صورت می گیرد. برای حالت میدان نویزی جهتی (غیرپخشنده) نیز بر اساس انرژی منابع موجود در محیط روشی برای خوشه بندی پیشنهاد شده است. سعی شده روش خوشه بندی پیشنهادی برای شرایط نویز جهتی، برای تمامی میدان های نویزی قابل بکارگیری باشد. در ادامه، ساختار جدیدی برای شکل دهنده پرتو gsc نیز پیشنهاد شده که با دادن نقش مختلف به هریک از خوشه های میکروفونی، عملکرد سیستم بهسازی گفتار را ارتقا می بخشد. بررسی نتایج نشان می دهد که در بعضی از حالت ها، استفاده از یک خوشه در مقایسه با بهره گیری از تمام میکروفون ها نتیجه بهتری را به دنبال داشته که این خود، حاکی از دستاوردی اضافه در فرایند خوشه بندی است. این دستاورد، کاهش تعداد میکروفون های استفاده شده در بهسازی گفتار می باشد که منجر به کاهش پیچیدگی و حجم محاسبات (در عین افزایش کیفیت خروجی) می شود.

حذف نویز پس زمینه در سیستم سونار پسیو
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1393
  حامد دهقانپور فراشاه   مسعودرضا آقابزرگی

وظیفه ی یک سیستم سونارِ پسیو، آشکارسازی، جهت یابی و تفکیک اهداف در محیط دریا می باشد. بهره گیری از خصوصیات طیفی به ویژه تونهای فرکانسی موجود در طیفِ سیگنال هدف یکی از راهکارهای دسته بندی اهداف می باشد. در این پژوهش پس ازمعرفی سونار پسیو، خصوصیات سیگنال شناور، نویز پس زمینه و ویژگیهای آن، چند روش مطرح در حذف نویز بر روی نمونه سیگنال هدف که صدای ضبط شده از پروانه یک شناور است پیادهسازی شده و تأثیر آنها بر بهبود دامنه تونهای فرکانسی نسبت به بخش پهن باند طیف و همچنین بهبود snr در سیگنال بهسازی شده تحلیل می شود. ابتدا به روش بهساز خط وفقی که یک روش وفقیِ مرسوم در بهسازی تونهای فرکانسیِ آمیخته با نویز پهن باند می باشد، پرداخته شده است. روش تخمین دامنه طیف کاربرد زیادی در بهسازی سیگنال گفتار دارد. با پیاده سازی چند الگوریتم مطرح تخمین دامنه طیف همچون تفریق دامنه و توان طیف، کارآیی چنین الگوریتمهایی در بهسازی سیگنال شناور که از نوع سیگنال آکوستیکی است مورد ارزیابی قرار گرفته است. شکل دهی پرتو بخش جدانشدنی از سامانه های سونار می باشد. با پیاده سازی روشهای مختلف شکل دهی پرتوی وفقی میزان بهبود حاصل شده در snr سیگنال خروجی اندازه گیری شده است. با دانستن و یا تخمین تابع همبستگیِ میدان نویزی می توان فیلتری در خروجیِ شکل دهنده ی پرتو طراحی کرد و snr را باز بهبود داد. این فیلتر که با عنوان پسافیلتر شناخته می شود به صورت گسترده در بهبود کیفیت گفتار به کار گرفته می شود. با شبیه سازی میدان نویزی همه جهته، پسافیلتر mccowan پیاده سازی و تأثیر آن بر طیف سیگنال شناور آمیخته با نویز بررسی شده است. روشهای ale و شکل دهی پرتوی وفقی استفاده زیادی در سیستمهای سونار پسیو دارند. شبیه سازی های انجام شده نشان داد استفاده از روشهای تخمین دامنه طیف و پسافیلتر نیز می تواند وضعیت تونهای فرکانسی را در طیف بهبود بخشد.

تحلیل و عیب یابی سیلندرهای موتور لکوموتیو از طریق پردازش سیگنال های ارتعاشی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی مکانیک 1393
  سعید غلامی نیا   منصور رفیعیان

تحقیق حاضر به صورت تجربی و با همکاری "مجموعه کارخانجات تعمیرات لکوموتیو بافق" صورت گرفته و بر اساس نیاز این مجموعه تعریف شده است. در این پژوهش توانایی تحلیل ارتعاشی برای یافتن لاینر تَرَکدار لکوموتیوهای دیزل آلستوم مورد بحث و بررسی قرار گرفته است. هدف، ارائه روشی غیرمخرب، سریع و قابل اطمینان در ترک سنجی لاینرهای موتورهای لکوموتیو دیزل آلستوم است که بتواند جایگزین روش های سنتی و وقت گیر کنونی شود. از جمله فواید این جایگزینی، می توان کاهش زمان تعمیرات، کاهش هزینه های جاری و افزایش بهره وری را نام برد. شایان ذکر است که در صورت عدم تشخیص بهنگام و کامل شدن ترک لاینر، خرابی های جبران ناپذیری به بار خواهد آمد. این خرابی ها گاه تا به حدی است که موتور به طور کامل از رده خارج می شود. سیگنال های ارتعاشی با نصب حسگر شتاب سنج بر دیواره بیرونی موتور ثبت شده اند. از آنجایی که طبق بررسی ها و تحقیقات انجام شده، الگوی بروز این عیب تاکنون معرفی نشده است، کارایی روش های مختلف پردازش سیگنال در این موضوع مورد بحث و بررسی قرار داده شده اند. برای این مهم تعدادی از متداول ترین و کارآمدترین روش های پردازش سیگنال مورد استفاده در عیب یابی ماشین آلات در سه حوزه زمان، فرکانس و زمان- فرکانس مورد بحث و بررسی قرار گرفته اند. در حوزه زمان، پارامترهای جذر میانگین مربعات، کرتوسیس و فاکتور تاجی بررسی شده اند. این پارامترها نتوانستند نتایج مناسبی به دست دهند. در حوزه فرکانس، تبدیل فوریه سریع و در حوزه زمان- فرکانس، تبدیل های فوریه زمان- کوتاه، موجک و هیلبرت- هوانگ مورد بررسی قرار گرفته اند. نتایج حاصله، حاکی از کارآمدی تمامی این روش ها در تمیز دادن لاینر معیوب از سالم هستند. همچنین تمامی این روش ها به جز تبدیل موجک، در پایش پیش بینانه ترک لاینرها نیز بسیار مناسبند.

توسعه و بهبود روش های مکان یابی چند منبع گفتار همزمان
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1393
  علی دهقان فیروزآبادی   حمیدرضا ابوطالبی

هدف از این رساله، مکان یابی چند گوینده هم زمان از روی سیگنال های گفتار هم پوشانی دار گوینده ها است. روش های مبتنی بر تابع همبستگی متقابل تعمیم یافته (gcc) از مهم ترین روش های مطرح در این زمینه هستند. این روش ها در شرایط نامطلوب آکوستیکی دقت مناسبی نداشته و هم چنین نمی توانند گوینده های نزدیک به هم را به خوبی مکان یابی کنند. مشکل دیگر نیز، الیاسینگ فضایی در سیگنال های میکروفونی است که باعث تخریب اطلاعات ورودی سیستم می شود. محور کلی روش های پیشنهادی در این رساله، پردازش های زیرباندی برای بهره گیری از عدم هم پوشانی محتوای فرکانسی گفتار گویندگان مختلف است. در اولین روش پیشنهادی، سیگنال های میکروفونی نخست به باندهای مختلفی (به صورت یکنواخت) تقسیم بندی می شوند. سپس تابع gcc برای همه زوج میکروفون ها در همه زیرباندها محاسبه شده و نمودار هیستوگرام محل دو قلّه اول تابع gcc برای هر زیرباند بدست می آید. در ادامه، با استفاده از روش متوسط گیری وزن دار، این هیستوگرام ها ترکیب و از روی هیستوگرام نهایی، راستای دو گوینده ی همزمان تخمین زده می شود. هر چند این روش افزایش دقت مکان یابی را به دنبال دارد، ولی مسأله ی الیاسینگ فضایی و لزوم مشخص بودن تعداد گوینده، دو مشکل اصلی باقیمانده در این روش است. دوّمین روش پیشنهادیِ این رساله، هدف خود را بر روی تخمین تعداد گوینده و حذف الیاسینگ فضایی قرار می دهد. با استفاده از روش خوشه بندی k-means و اصل silhouette، روشی مبتنی بر پردازش های زیرباندی برای تخمین تعداد گوینده معرفی و سیستم مکان یابی به حالت بیش از دو گوینده تعمیم می یابد. سپس به منظور حذف الیاسینگ فضایی، آرایه میکروفونی دایره ای تودرتو پیشنهاد داده می شود که می تواند الیاسینگ فضایی را برای میکروفون های دور از هم حذف کند. علاوه بر این، با بهره گیری از یک بلوک تخمین نویز و استفاده وفقی از فیلترهای phat و ml، دقت سیستم در تخمین راستای گوینده در حضور نویز و انعکاس افزایش می یابد. در دو روش قبلی، فیلترهای استفاده شده بدون توجه به محتوای فرکانسی سیگنال گفتار اعمال می شود. در قسمت سوم رساله، استفاده از فیلترهای گاماتون را پیشنهاد می دهیم که متناسب با سیستم شنوایی انسان بوده و بر روی محتوای فرکانس پایین طیف سیگنال گفتار، قدرت تفکیک فرکانسی بالاتری دارند. ترکیب استفاده از این بانک فیلتر با روش زیرباند کردن با آرایه تودرتو، اگرچه حجم محاسبات را کمی بالا می برد ولی دقت تخمین های بدست آمده را تا حد مطلوبی افزایش می دهد. در ادامه برای کاهش بار محاسباتی، با تخمین طیف سیگنال گفتار از روش pwelch، فیلترهای گاماتون فقط بر روی نواحی پردامنه طیف گفتار بکار گرفته شده و سپس پردازش های زیرباندی با آرایه تودرتو بر روی خروجی فیلترهای گاماتون اعمال می شود. این اقدام ضمن حفظ دقت تخمین در حد روش قبلی، حجم محاسبات را تا حد خوبی کاهش می دهد. ارزیابی های این رساله بر روی سناریوهای مختلف محیطی اعم از انعکاسی، نویزی، و نویزی و انعکاسی توأم و هم چنین بر روی داده های واقعی و شبیه سازی و به ازای یک، دو و سه گوینده هم زمان انجام شده است. در ارزیابی های انجام شده، روش subband-gcc با روش های fullband و هم چنین subband-srp مقایسه شده است که برتری روش پیشنهادی را نشان می دهد. هم چنین در ادامه روش های پیشنهادی آرایه های تودرتو، فیلتر گاماتون و تخمین طیف نیز مورد ارزیابی و مقایسه قرار گرفته است که نتایج نشانگر برتری روش های پیشنهادی نسبت به روش های مرسوم می باشد.

روش های مبتنی بر تأخیر زمانی برای مکان یابی منابع صوتی با استفاده از آرایه های میکروفونی با ساختار نامنظم
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1393
  صبا اسکندری دهکردی   حمیدرضا ابوطالبی

مکان یابی منبع گفتار یکی از شاخه های مهم بحث پردازش گفتار می باشد. هدف روش های مکان یابی منابع، دستیابی به دقت بالاتر در مکان یابی می باشد. تلاش برای افزایش دقت، نوعاً افزایش حجم محاسبات را در پی خواهد داشت. در میان روش های مرسوم مکان یابی بر پایه tdoa (time difference of arrival) و srp (steered response power)، روش های مبتنی بر انرژی و جستجوی فضا دقت بالاتر را در کنار حجم بالای محاسباتی دارا هستند. در مقابل روش های مبتنی بر tdoa با حجم کم محاسبات ولی با دقت پایین مکان یابی را انجام می دهند. از طرفی در چند سال اخیر، استفاده از آرایه های نامنظم (یا ad-hoc) در مقایسه با آرایه های منظم توسعه بیشتری یافته است. هدف از این پایان نامه، معرفی یک روش مکان یابی در شبکه های میکروفونی با چیدمان ad-hoc است که ضمن حفظ دقت مکان یابی، حجم محاسباتی متناسبی نیز داشته باشد. دستیابی به این هدف، مستلزم استفاده از یک روش ترکیبی (ترکیب روشهای مبتنی بر انرژی و tdoa) است. روش پیشنهادی از سه گام تشکیل شده است. در گام اول بر اساس روش های مبتنی بر انرژی، و سپس استفاده از یکی از دو روش 1) جستجوی مستطیل های محدود کننده فضایی، و یا 2) دوایر متحدالمرکز، ناحیه محدودتری از فضا که منبع در آن واقع است، تخمین زده می شود. در گام دوم، tdoa بین جفت میکروفون های دو دسته از حسگرها که بیشترین انرژی را دارند، محاسبه، و در گام سوم با حداقل سازی یک تابع خطا، نقطه ای از فضا که ارضا کننده مقادیر بدست آمده برای tdoaهاست، به عنوان نتیجه مکان یابی بدست می آید. با آزمایش بر روی سناریوهای متفاوت و موقعیت های مختلف گوینده، کارایی بالای روش پیشنهادی در مقایسه با دو روش پایه tdoa و srp نشان داده شده است. در ادامه این تحقیق، از روش پیشنهادی برای مکان یابی منابع همزمان نیز استفاده گردیده و برتری کارایی آن در مقایسه با یکی از مهم ترین روش های مکان یابی منابع همزمان نشان داده شده است.

بهسازی چندکاناله سیگنال گفتار با استفاده از روش های مبتنی بر تخمین در حوزه فرکانس
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1393
  آسیه علی بیکی منشادی   حمیدرضا ابوطالبی

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی و وجود عوامل مخرب محیطی از جمله نویز، بهسازی گفتار از اهمیت زیادی برخوردار است. برای بهسازی گفتار روش های مختلفی وجود دارد که برخی مبتنی بر تخمین در حوزه زمان و برخی مبتنی بر تخمین در حوزه فرکانس هستند. روش های بهسازی گفتار را می توان به انواع روش های تک کاناله، آرایه میکروفونی و میکروفون های توزیع شده تقسیم کرد. ساختار میکروفونی توزیع شده ساختاری است که محدودیتی در چیدمان و محل قرار گیری میکروفون ها ندارد. هدف در این پایان نامه، ارائه روش هایی برای بهسازی گفتار با استفاده از روش های مبتنی بر طیف در سیستم چندکاناله توزیع شده است. برای بهسازی چندکاناله سیگنال گفتار، یک ایده کلی، تعمیم روش های تک کاناله بهسازی گفتار است. در این پایان نامه چند روش برای بهسازی چندکاناله سیگنال گفتار، ارائه شده که دو مورد از آنها بر اساس تعمیم روش های تک کاناله موجود است. تمامی این روش ها به نوعی بهبود یافته دو روش mstsa (تخمین چندکاناله دامنه طیف کوتاه مدت) و mlsa (تخمین چندکاناله لگاریتم دامنه طیف) هستند. در این پایان نامه با الهام گرفتن از روند طراحی روش om-lsa، با وارد کردن احتمال حضور گفتار در رابطه mlsa، روش om-mlsa را پیشنهاد داده ایم که عملکرد بهتری در مقایسه با mlsa دارد. همچنین تخمین مرتبه دامنه طیف ( -order stsa) را برای سیستم تک کاناله بررسی کرده و سپس با تعمیم آن به سیستم چندکاناله، روش -order mstsa را ارائه داده ایم. در ادامه، با وارد کردن ماتریس همبستگی بین فرکانسی در روابط mstsa و mlsa، دو تخمین زن imp-mstsa و imp-mlsa ارائه شده که بهبود قابل ملاحظه ای در عملکرد سیستم بهسازی گفتار چندکاناله ایجاد می کند.

بهسازی و بهبود قابلیت فهم سیگنال گفتار آغشته به انعکاس
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1385
  فرهاد فغانی   حمیدرضا ابوطالبی

چکیده ندارد.

بکارگیری تبدیل موجک در جداسازی کور منابع و استفاده در استخراج ecg جنین
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1386
  جمال فلاحیان مهرجردی   مسعودرضا آقابزرگی صحاف

چکیده ندارد.

بهبود عملکرد روشهای چند کاناله بهسازی گفتار در شرایط واقعی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1384
  مجید پوراحمدی   حمیدرضا ابوطالبی

چکیده ندارد.

مکان یابی منبع سیگنال گفتار بوسیله آرایه های میکروفونی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1386
  حسین مومن زاده حقیقی   حمیدرضا ابوطالبی

چکیده ندارد.

جداسازی سیگنال های گفتار و موسیقی با بکارگیری الگوریتم جداسازی کور منابع
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1387
  آرش پیشرویان   مسعودرضا آقابزرگی

چکیده ندارد.

کاربرد روشهای سلسله مراتبی در سیستم های بازشناسی بلادرنگ چهره
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1387
  هاجر مومنی   محمدتقی صادقی

چکیده ندارد.

استخراج منابع گفتار هدف با استفاده از الگوریتم جداسازی کور منابع در حوزه ی فرکانس
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1387
  مرجان غلامرضایی   مسعودرضا آقابزرگی

چکیده ندارد.

بهسازی گفتار با استفاده سیستمهای gsc
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
  طاهره زارع بیدکی   حمیدرضا ابوطالبی

نویز و انعکاس مهمترین عوامل محیطی موثر در تخریب سیگنال گفتار محسوب می شوند. هدف از این تحقیق بررسی یکی از پرکاربردترین ساختارهای بهسازی گفتار با نام حذف کننده لوب های فرعی (gsc) در مقابله با نویزهای جهت دار محیط است.به دنبال کاربردهای زیاد ساختار gsc برای حذف نویزهای جهت دار در حوزه سیگنال های باندباریک (همچون رادار، سونار و ...)، استفاده از این ساختار با هدف مقابله با نویزهای باندوسیع موجود بر روی سیگنال گفتار رایج شده است.در این پایان نامه، ضمن معرفی شکل دهنده های پرتو مقیّد از جمله lcmv و frost، هر یک از بلوک های ساختار gsc که تعمیمی از دو ساختار قبل است و بررسی نقش هر یک از این بلوک ها در حذف نویز پرداخته شده است. در ادامه نیز ساختارهای ترکیبی مرتبط با ساختار gsc برای کاربرد بهسازی سیگنال گفتار به همراه مقایسه نقاط ضعف و قوّت هر یک بررسی شده است.از آنجایی که اکثر سیگنال های نویز از طیف فرکانسی باندوسیع برخوردار هستند، شکل دهنده های پرتو باندباریک (از جمله ساختار gsc) نمی توانند نقش موثری در پاکسازی سیگنال گفتار از آن ها ایفا کنند. بر این اساس، با هدف ارتقای کیفیت بهسازی، ساختارهایی مانند شکل دهنده های پرتو مستقل از فرکانس (cdb) و ساختارهای زیرآرایه ای بررسی شده است. در ادامه، با تعمیم کارهای قبلی، ساختارهای ترکیبی cdb-gsc و cdgsc برای بهبود فرایند بهسازی سیگنال گفتار ارائه شده است.در پایان، به منظور ارزیابی ساختارهای پیشنهادی، به پیاده سازی آن ها و سنجش کارآیی آن ها بر روی دو دسته دادگان شبیه سازی شده و دادگان واقعی (ضبط شده در آزمایشگاه پردازش گفتار دانشگاه یزد) پرداخته شده است.نتایج حاصل از آزمایش های صورت گرفته روی سیگنال های گفتار (با طیف فرکانسی 400 تا 8000 هرتز) و منابع نویزی مختلف، بیانگر عملکرد مناسب ساختارهای پیشنهادی در بهسازی سیگنال گفتار و مقابله با نویزهای محیط است.

روشهای ترکیبی و چندمیکروفونه حذف پژواک از سیگنال گفتار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
  بهداد دشت بزرگ   حمیدرضا ابوطالبی

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته است که در همه این کاربردها وجود نویز و پژواک به عنوان عامل مخرب شناخته می شود. در طول چند دهه اخیر روش های متعددی برای حذف و کاهش پژواک ارائه شده که عمدتاً در دو دسته تک میکروفونه و چندمیکروفونه تقسیم می شود. در سیستم های تک میکروفونه نوعاً روش های طیفی کاهش پژواک مورد استفاده قرار می گیرد در حالی که در روش های مبتنی بر آرایه میکروفونی پردازش های مکانی مبنای کار می باشد. در این پایان نامه پس از بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز از جمله دو روش تخمین مرتبه متغیر mmse و omlsa، با ترکیب این دو، روش جدیدammse ارائه شده است. این روش دارای دو پارامتر مرتبه تخمین و احتمال شرطی حضور گفتار است. در ادامه، روش جدیدی برای محاسبه مرتبه تخمینammse ارائه داده ایم که بر خلاف روش های گذشته، این پارامتر را نه تنها برای هر فریم، بلکه برای هر مولفه فرکانسی به صورت جداگانه محاسبه می نماید. برای محاسبه مرتبه تخمین، رابطه ای خطی با احتمال شرطی حضور گفتار برای آن تعریف کرده و همچنین تأثیر انتخاب مقادیر منفی را برای این پارامتر بررسی نموده ایم. در ادامه، تعمیم روش پیشنهادی ammse در شرایط که پژواک حضور دارد، ارائه شده است و کارایی آن در محیط های واقعی که به طور همزمان دارای نویز و پژواک است مورد بررسی قرار گرفته است. در ادامه این پایان نامه، به ترکیب روش های پردازش مکانی و پردازش طیفی در سیستم های آرایه میکروفونی پرداخته و از میان پردازنده های مکانی، gsc و نمونه مناسب تر آن برای کاربرد حذف پژواک، یعنی tf-gsc را انتخاب کرده ایم. و با قرار دادن تخمین گر ammse در خروجی پردازنده های مکانی، دو ساختار ترکیبی جدید به نام های gsc-ammse وtf-gsc-ammse ارائه نموده ایم. نشان داده شده است که gsc-ammse کارایی چشمگیری در کاهش نویز دارد و روش tf-gsc-ammse نیز مقدار نویز و پژواک را به مقدار قابل توجهی کاهش می دهد.