نام پژوهشگر: طه همدانی

بهبود تقطیع تصاویر rgbd با استفاده از مدل تصادفی مارکوف
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  طه همدانی   احد هراتی

در این پایان نامه، ما در ابتدا دسته بندی و نگرشی کلی از روش های تقطیع تصاویر رنگی ارائه دادیم و در ادامه روی این موضوع بحث کردیم که اگر در کنار داده ی رنگ، داده ی عمق هم داشته باشیم، روش های موجود چه تغییراتی پیدا خواهند کرد و چه روش های جدیدی به وجود خواهد آمد. از آنجا که حسگر های زیادی برای جمع آوری اطلاعات محیط پیرامون یک روبات متحرک وجود دارد، بر آن شدیم تا مسئله خود را به صورت محدود روی حسگر کینکت ماکروسافت و داده های عمق و رنگی که از این حسگر در اختیار ما قرار می گیرد، بررسی کنیم. این حسگر با توجه به جدید بودن فناوری آن، در مقایسه با سایر حسگر های نظیر خود، وزن و اندازه ی کمتری دارد و به همین دلیل کار های زیادی در سال های اخیر به داده های این حسگر تخصیص یافته است. ما در این پایان نامه در فصل چهارم، ساختار این حسگر و سازوکار تخمین عمق آن را به صورت محدود بررسی می کنیم و یک روش پیشنهادی برای هموار سازی این گونه تصاویر به صورتی که نقاط با ارزش و گوشه برای ما از گرد شدن محفوظ بمانند، ارائه می دهیم و برای روش پیشنهادی تقطیع خود، از این داده ی هموار شده به جای داده ی خام حسگر کینکت استفاده می کنیم. سپس روش پیشنهادی خود را برای تقطیع تصاویر rgb-d به این صورت پیشنهاد می دهیم: روش پیشنهادی ما برای تقطیع تصویر، بر اساس مدل احتمالاتی آماری مدل تصادفی مارکوف است که سعی کردیم با اضافه کردن محدودیت هایی که از تصویر عمق و هندسه محیط به مسئله اضافه می کنیم به تقطیع مناسبی از صحنه برسیم که مورد استفاده روبات برای سایر اعمال خود مانند تشخیص اشیاء یا بازسازی سه بعدی محیط قرار گیرد. از این رو در ابتدا سعی کردیم تا با توجه به اطلاعات هندسی محیط و همچنین رنگ به اَبَر پیکسل هایی از صحنه برسیم که برای مقدار دهی اولیه به مسئله مورد استفاده قرار می گیرد. این اَبَر پیکسل ها با توجه به لبه های موجود در تصاویر رنگی و همچنین لبه هایی از صحنه که جهت بردار نرمال در همسایگی آن تغییر محسوسی می کند بدست آمده است. در ادامه با توجه به ماهیت مسئله خود، تابع انرژی مورد استفاده در مدل تصادفی مارکوف را با اضافه کردن اجزاء به آن شکل می دهیم. بنابراین با تعریف تابع انرژی مناسب، به دنبال استفاده از یک مینیموم کننده تابع انرژی بهینه هستیم که با توجه به تابع انرژی تولید شده توسط ما، بتواند در نزدیکی مینیموم اصلی تابع و در زمان معقول و مناسب، متوقف شود. خروجی که این مینیموم کننده تابع انرژی به ما می دهد، همانطور که در فصل های گذشته بحث شد، برچسب ها و قطعات تصویر ما هستند. با توجه به نتایج بدست آمده و مقایسه آن با روش ها و کار های دیگر از نظر دو مقیاس فاصله هاستورف و روش هوور، روش پیشنهادی ما برای تقطیع تصویر، نتایج را بهبود بخشیده است و در انتها به تقطیع بهتری از محیط با توجه به هندسه محیط دست یافته است.