میرهادی سید عربی

تعقیب وسیله نقلیه در شبکه حسگری دیداری با استفاده از فیلتر ذره ای

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز 1389
حمیده رضایی میرهادی سید عربی

تعقیب در شبکه حسگری دیداری یکی از مسائل مهم و قابل توجه در سیستم های هوشمند و بینایی ماشین در سال های اخیر به شمار می رود. در این پایان نامه الگوریتم تعقیب بر پایه یک دوربین مورد بررسی قرار گرفته و نتایج به دست آمده، به شبکه ای از دوربین ها تعمیم داده شده است. ترکیب ویژگی های رنگ، بافت، لبه و حرکت که مقید به ساختار محیط پیرامون می باشد، جهت تخمین موقعیت هدف در قالب رویکرد تصادفی و فیلتر ذرات استفاده شده است. ابزار های به کار گرفته شده باعث افزایش دقت و کارایی سیستم پیشنهادی تعقیب در این پایان نامه می گردند. الگوریتم پیشنهادی قادر به بهبود تخمین موقعیت هدف به میزان 4/8 پیکسل به طور میانگین می باشد. حرکت هدف در ارتباط با ساختار محیط می تواند به جنبه دیگری از اطلاعات تصویری دسترسی پیدا کند که از دید دیگر ویژگی ها پنهان مانده است. حرکت مقید، محدوده تخمین نمونه های توزیع فیلتر را متمرکز می نماید. بنابراین با وجود کاهش 50% تعداد نمونه ها نتایج تعقیب همچنان قابل استناد می باشد. تعیین پارامتر های مختلف سیستم و ترکیب ویژگی ها به صورت تطبیقی نیز در افزایش دقت تاثیر گذار است. به منظور تعقیب در شبکه حسگری دیداری، الگوریتم پیشنهادی در هر دوربین به طور مستقل اعمال می گردد. نتایج به دست آمده برای موقعیت هدف در هر فریم، بر روی صفحه زمینه ترکیب می شوند. تعقیب نهایی که نتیجه ترکیب عملیات چند دوربین است، متمرکز و خلاصه شده در تصویر زمینه ایجاد می گردد. این مسئله به کاهش حجم اطلاعات قابل ارسال کمک به سزایی می کند. یکی از مشکلات اساسی تعقیب انسداد هدف می باشد. در این پایان نامه از وجود چند نما در شبکه حسگری دیداری نسبت به یک صحنه خاص جهت رفع این پدیده استفاده شده است. یکی از مزایای این روش قابلیت تعقیب هدف مسدود شده به مدت طولانی و انسداد کامل می باشد.

First 15 pages

بهبود کیفیت گفتار بر پایه روش های زیر فضائی با استفاده از تکنیک های حذف نویز ادراکی

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز 1388
ساناز قایمی مسعود گراوانچی زاده

بهبود کیفیت سیگنال گفتار (speech enhancement)، نقش مهمی در سیستم های مخابراتی صوتی ایفا می کند. تکنیک های بهبود کیفیت سیگنال گفتار برای سمعک ها و وسایلی که در محیط های سیار استفاده می شوند، مانند تلفن های موبایل و hands free کاربرد زیادی دارند. روش های زیادی برای کاهش اثر نویز در سیگنال های صوتی ارائه شده است. از این میان می توان به روش های مبتنی بر تفریق طیفی، فیلتر وفقی، فیلتر وینر و تبدیل موجک اشاره نمود. همچنین تکنیک های متفاوتی جهت کاهش اثر نویز با استفاده از روش های غیر خطی نیز وجود دارد. در میان روش های ذکرشده جهت کاهش اثر نویز، می توان از تکنیک تجزیه به مقادیر منفرد (singular value decomposition; svd) در راستای بهبود کیفیت سیگنال ها از جمله سیگنال گفتار سخن گفت. روش های بهبود کیفیت گفتار در کنار حذف نویز از سیگنال گفتار باعث ایجاد اغتشاش و اعوجاج می شوند. اعوجاج واغتشاش با اعمال فیلتر نرم کننده طیف سیگنال گفتار بهبود یافته، کاهش می یابد، که این فیلتر از مشخصات سیستم شنوایی انسان کمک می گیرد. در این پایان نامه ابتدا روش های زیرفضای سیگنال ادراکی موجود را بررسی کرده و سپس الگوریتم های جدید زیرفضای سیگنال ادراکی به نام های pcritqsvd (perceptual constrained rank independent truncated quotient svd)، pcmritqsvd (perceptual constrained modified ritqsvd) و pcmritqsvd-pso (pcmritqsvd-particle swarm optimization) پیشنهاد می شوند. کارایی روش های زیرفضای سیگنال ادراکی جدید در مقایسه با روش های سنتی بهبود کیفیت سیگنال گفتار، بهبود داده می شود. معیارهای ارزیابی مختلفی بالا بودن کارایی این روش ها را نسبت به روش های قبلی نشان می دهند.

First 15 pages

چهارچوبی جهت تشخیص ژست دست با استفاده از فیلتر کالمن و مدل مخفی مارکوف

thesis وزارت علوم، تحقیقات و فناوری - موسسه آموزش عالی غیر انتفاعی و غیر دولتی نبی اکرم - دانشکده فنی 1391
مرتضی محمدی قراسویی میرهادی سید عربی

هدف از محاوره انسان و کامپیوتر، رسیدن به محاوره ای شبیه به کار انسان با انسان در مورد انسان با کامپیوتر می باشد. ژست ها نقش مهمی را در زندگی روزانه انسان ها جهت انتقال اطلاعات و بیان احساسات بازی می کنند. ژست ها پیامدی از حرکت بخشی از بدن می باشند که یکی از این حرکت های بسیار پرکاربرد حرکت دست می باشد که به عنوان ژست پویای دست شناخته می شود. بنابراین دنبال کردن دست و تشخیص حرکت آن بسیار مهم بوده و می تواند کاربردهای همه منظوره ای را فراهم کند. در این پایاننامه چارچوبی برای تشخیص ژست های ایزوله و ژست های پویای دست پیشنهاد شده است که از فیلتر کالمن جهت دنبال کردن دست و از مدل مخفی مارکوف جهت تشخیص حرکت دست استفاده شده است. همچنین فرض شده است که فرد در جلوی دوربین فاصله خود را تغییر نداده و دوربین فیلمبرداری ثابت بوده و هیچ حرکتی ندارد. در این چارچوب جهت تشخیص ژست های پویای دست از اعداد و حروف انگلیسی استفاده شده است. برای تشخیص از ویژگی زاویه با دو تقسیم بندی 20 و 45 درجه استفاده شده است. در ژست های پویا جهت کشف و تشخیص از اعداد انگلیسی استفاده شده است. به طور کلی ژست های پویای دارای دو نوع ژست معنی دار (اصلی) و بیمعنی می باشند. این ژست ها در دنباله ویدیویی باید تفکیک شوند. جهت تشخیص ژست های معنی دار می بایست آنها را در دنباله ویدیویی کشف کرد. به همین منظور جهت کشف ژست های معنی دار از یک روش ابتکاری استفاده شده است که با استفاده از آن نقطه شروع و پایان ژست معنی دار در دنباله ویدیویی مشخص می شود. پس از مشخص شدن نقطه شروع و پایان ژست معنی دار، مسیر بین این دو نقطه جهت تشخیص به مدل مخفی مارکوف داده می شود تا ژست پویای انجام شده، کلاس بندی شود. چارچوب پیشنهادی، کارایی خوبی را در کشف و تشخیص ژست های پویا نشان می دهد. همچنین این سیستم از نظر پیچیدگی محاسباتی بسیار مناسب بوده به طوری که هدف کاهش هزینه های محاسباتی در نظر گرفته شده است و در صحنه های پیچیده توانمندی مناسبی را فراهم میکند.

First 15 pages

بخش بندی اتوماتیک دندان ها با استفاده از تصاویر x-ray

thesis موسسه آموزش عالی غیر انتفاعی و غیر دولتی نبی اکرم (ص) - دانشکده فنی 1391
فاطمه سروش میرهادی سید عربی

یکی از پیچیده ترین کار ها در پردازش تصاویر دیجیتال، بخش بندی تصاویر است. به دلیل افزایش توجه به این تکنیک توسط محققان و تبدیل آن به یک نقش حیاتی در بسیاری از زمینه های کاربردی مثل کاربرد های پزشکی مورد استفاده قرار می گیرد.

پیشگویی قابلیت فهم گفتار در افراد دارای ضعف شنوایی

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر 1394
هادی جمشیدی اوانکی مسعود گراوانچی زاده

یک معیار اندازه گیری قابلیت فهم که همبستگی زیادی با نتایج تست های شنوایی دارد، دارای اهمیت بسیاری در بسیاری از کاربرد ها از جمله طراحی ادوات کمک شنوایی می باشد. این پایان نامه به مسئله ی پیشگویی قابلیت فهم سیگنال گفتار برای شنونده های دارای ضعف شنوایی می پردازد که راه حل پیشنهادی آن در خصوص شنونده های عادی نیز به عنوان شرایط خاصی که در آن میزان ضعف شنوایی قابل اغماض است، کاربرد پذیر است. در این روش، ابتدا یک شبیه ساز ضعف شنوایی، با استفاده از داده های شنوایی سنجی بیماران دارای وزوز گوش در یک یا دو گوش خود، آثار مختلف ضعف شنوایی را مدل می کند. سپس، با توجه به اینکه ضعف شنوایی حسی-عصبی در قالب اثر ارتقاء سطح آستانه شنوایی در توزیع زمانی و از طریق آلایش غیرخطی در توزیع طیفی سیگنال گفتار اثر می گذارد، مدل پیشنهادی ابتدا به محاسبه مزیت دوگوشی می پردازد و سپس براساس رابطه ی یافته شده بین اطلاعات مشترک محاسبه شده میان پوش سیگنال های آلوده و تمیز و نرخ تشخیص گفتار معیار آستانه ی ادراک گفتار (srt) را در شرایط مختلف به دست می آورد. روش پیشنهادی بر خلاف بسیاری از مدل های پیشین خود در مرحله ی نهایی پیشگویی نیازی به نتایج آزمون های عینی قابلیت فهم گفتار ندارد. srt دوگوشی برای 13 شنونده با شنوایی عادی، برای 3 نوع منبع تداخل در 14 پیکربندی مختلف شامل شرایط یک، دو و سه منبع تداخل و srt تک گوشی برای 20 شنونده با شدت های مختلف ضعف شنوایی حسی-عصبی یک طرفه و دوطرفه اندازه گیری شد. ارزیابی نتایج پیشگویی مدل های پایه و پیشنهادی و مقایسه آن ها با اندازه گیری ها نشان داد که میانگین ضریب همبستگی بین srt های پیش بینی-شده و اندازه گیری شده حدود 93/0 بوده و میانگین خطای بین آن ها از 2 دسی بل کمتر است. به طور خلاصه، مدل پیشنهادی در پیشگویی قابلیت فهم سیگنال های گفتار vcv آلوده به نویز جمع شونده عملکرد بسیار خوبی دارد و عملکرد آن همچنین از مدل های پایه، بدون نیاز به تنظیم پارامترهای مدل با استفاده از اندازه-گیری های عینی برای وضعیت مورد آزمایش، بهتر است.

نام پژوهشگر: میرهادی سید عربی