نام پژوهشگر: پروین رزاقی
پروین رزاقی شادرخ سماوی
در این رساله مسئله ی درک صحنه ی دو بعدی مورد بررسی و تحلیل قرار می گیرد. هدف اصلی در درک صحنه ساخت ماشینی است که قادر باشد همانند انسان ببیند و اصول کلی و موقعیت فعلی تصویر را دریابد. درک صحنه ی دو بعدی شامل دو هدف مهم شناسایی شی و بخش بندی معنایی تصویر می باشد. با بررسی روش های ارائه شده در شناسایی شی و بخش بندی معنایی تصویر، می توان به این نتیجه رسید که جهت اصلی تمامی روش های ارائه شده در سال های اخیر، دخالت دادن اطلاعات سطح بالا به صورت روشی صحیح و موثر می-باشد. در این رساله، نحوه ی دخالت موثر اطلاعات سطح بالا در مسئله ی درک صحنه ی دو بعدی مورد بررسی قرار گرفته است. برای انجام این امر از نحوه ی تفکر انسان بهره گرفته شده است. به همین دلیل، اطلاعات سطح بالا از طریق گروه بندی کردن صریح اطلاعات سطح پایین به دست می آید. در اکثر کارهای ارائه شده برای دخالت اطلاعات سطح بالا در درک صحنه، استخراج اطلاعات به صورت ضمنی صورت پذیرفته است. در استخراج ضمنی، اطلاعات سطح بالا به گونه ای استخراج می شوند که در میان کل مجموعه داده ی آموزشی بتواند اطلاعات متمایزکننده ای را در اختیار قرار دهد. در حالیکه اگر گروه بندی اطلاعات در یک تصویر به طور جداگانه صورت بپذیرد و سپس با استفاده از مجموعه تصاویر دیگر اطلاعات به تدریج کامل گردد، نتایج بهتری در پی خواهد داشت. زیرا انسان نیز، با مشاهده تنها یک تصویر شالوده اصلی اطلاعات را در ذهن می سازد و با مشاهده تصاویر دیگر اطلاعات در ذهن کامل می گردد. ایده پیشنهادی در دو حوزه ی مهم درک صحنه ی دو بعدی، شناسایی شی و بخش بندی معنایی، مورد بررسی قرار گرفته است. در شناسایی شی با استفاده از ایده پیشنهادی، پاره هایی برای شی استخراج می گردد که بامعنا بوده و دارای اطلاعات متمایزکننده می باشد. برای استخراج پاره ها ویژگی های سطح پایین به صورت صریح در یک تصویر گروه بندی می گردند. سپس متناظر هر پاره در تصاویر آموزشی دیگر با استفاده از مدل ساختار ضمنی سلسله مراتبی پیشنهادی استخراج می گردد. روش به گونه ای طراحی شده است که تنها با استفاده از یک نمونه آموزشی نیز قادر به شناسایی می باشد. در حوزه ی بخش بندی معنایی، روشی غیرپارامتریک با استفاده از گروه بندی کردن صریح ناحیه ها پیشنهاد شده است که قادر است اطلاعات سطح شی و ساختار میان اشیا را برخلاف دیگر روش ها بدون استفاده از روش های شناسایی شی، دخالت دهد. همچنین روش پیشنهادی غیرپارامتریک ارائه شده، برای نخستین بار مسئله را بدون نیاز به تناظر وصله حل نموده است. همین امر موجب می گردد که روش پیشنهادی بسیار سریعتر از دیگر روش های ارائه شده در این حوزه باشد. نتایج روش پیشنهادی ارائه شده در حضور داده های سرپرستی کامل و نیمه سرپرستی مورد بررسی و تحلیل قرار گرفته است. نتایج به دست آمده بیانگر موفقیت روش پیشنهادی می باشد. در انتها، کاربرد بخش بندی معنایی در حوزه ی تغییر اندازه ی تصویر براساس محتوا مورد بررسی قرار می گیرد. کاربرد بخش بندی معنایی در حوزه ی تغییر اندازه ی تصویر به گونه ای طراحی شده است که قابلیت تطبیق با اولویت های متفاوت از دید انسان های مختلف را دارا باشد. روش پیشنهادی از طریق دو معیار مقایسه ی بصری و ارزیابی فردی مورد برررسی و تحلیل قرار گرفته است.