نام پژوهشگر: شیما قاسمی
شیما قاسمی نیلوفر قیصری
تشخیص نوع فعالیت انسان در دنباله ای از تصاویر ویدئویی یک موضوع مهم و پویا در بینایی کامپیوتر می باشد. این امر به برچسب گذاری دنباله تصاویر با برچسبی از فعالیت ها اطلاق می شود و به علت کاربردهای گسترده آن توجه زیادی را به خود جلب نموده است. از جمله کاربردهای آن می توان به سیستم های نظارت هوشمند، هدایت روبات ها، اتومبیل های خودکار و اندیس گذاری ویدئو اشاره کرد. مسئله ی تشخیص نوع فعالیت انسان را می توان ترکیبی از نمایش ویژگی های فعالیت های مختلف و دسته بندی آنها دانست. این کار با مشکلاتی از قبیل تغییر حالت فعالیت ها، وضعیت ضبط ویدئو، تفاوت های بین افراد مختلف، تغییر زاویه دید، همپوشانی و تغییر اندازه روبرو است. در قسمت نمایش تصویر، فعالیت انسان را می توان نوع خاصی از یک الگوی بافت پویا در نظر گرفت. در این پایان نامه از ایده ی تحلیل زمانی-مکانی با استفاده از توصیفگر بافت پویا بر روی ویژگی های محلی برای تشخیص نوع فعالیت انسان استفاده شده است. برای این کار ابتدا نقاط کلیدی زمانی-مکانی با استفاده از روش لپتو استخراج می شوند. سپس این نقاط با کمک توصیفگر بافت پویایlbp-top توصیف خواهند شد. در مرحله ی بعد با استفاده از یک الگوریتم خوشه بندی، ویژگی ها را در خوشه هایی دسته بندی می کنیم بطوریکه مرکز هر خوشه به عنوان نماینده ی سایر اعضای آن خوشه می باشد. به منظور سهولت مقایسه ی ویژگی ها و دسته بندی فعالیت ها یک فرهنگ لغت ایجاد کرده و مرکز هر خوشه را به عنوان یک کلمه در این فرهنگ لغت لحاظ می کنیم. پس از آن هر فعالیت را با توجه به تعداد تکرار هر کلمه ی موجود در فرهنگ لغت در آن، در قالب یک هیستوگرام توصیف می نماییم. در نهایت نمونه های تست برای ارزیابی روش پیشنهادی وارد سیستم خواهند شد و عملیات دسته بندی توسط دو الگوریتم دسته بندیk نزدیکترین همسایه و ماشین بردار پشتیبان انجام می شود. به منظور ارزیابی الگوریتم پیشنهادی، آن را بر روی پایگاه داده kth شامل 6 فعالیت مختلف آزمایش کرده ایم. این روش قادر است با دقت 90.27% به تشخیص فعالیت های موجود در این پایگاه داده بپردازد.