نام پژوهشگر: جلال الدین نصیری

بازشناسی اعمال انسان با رویکرد مقاوم سازی دسته بند تفکیکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر 1394
  جلال الدین نصیری   نصراله مقدم چرکری

با توجه به گسترش روزافزون داده های ویدئویی، تحلیل و فهم خودکار محتوای داده های ویدئویی از اهمیت بیشتری برخودار گشته است. از میان کاربردهای متنوع فهم ویدئو، مواردی که به تحلیل حرکات و اعمال انسان می پردازند از توجه ویژه ای برخوردار شده اند. عوامل گوناگونی مانند تغییرات نوری و انسداد منجر به استخراج ویژگی های نامناسب می شود. از طرف دیگر انجام یک عمل به گونه های متفاوت باعث پدید آمدن نمونه های پَرت برای آن دسته از عمل خواهد شد. جلوگیری از به وجود آمدن نمونه های پرت و نویزی در محیط های واقعی غیرممکن خواهد بود. بنابراین یک رویکرد مناسب جهت یادگیری صحیح اعمال انسان، کم کردن اثر داده های نویزی و پرت در یادگیری دسته بند خواهد بود. در این رساله به صورت مشخص بر روی دسته بند بازشناسی اعمال انسان تمرکز شده است. دسته بندهای تفکیکی با استفاده از نمونه های آموزش، ابرسطحی را به عنوان مرجع تصمیم گیری پیدا می کنند. ماشین بردار پشتیبان دوقلو (twsvm) یک رویکرد جدید از دسته بندهای تفکیکی می باشد که بر خلاف svm بر پایه حاشیه ناموازی استوار است. حساسیت به نمونه های نویزی، مشکل دادگان نامتوازن، ناحیه های بدون تصمیم در مدل چنددسته ای و سرعت یادگیری از جمله چالش هایی است که در دسته بندی بازشناسی اعمال انسان وجود دارد. در این رساله سه دسته بند ماشین بردار پشتیبان دوقلو مبتنی بر انرژی، توسعه ی چند دسته ای ماشین بردار پشتیبان دوقلو مبتنی بر انرژی و دسته بند ذاتا چند دسته ای ماشین بردار پشتیبان دوقلو بر مبنای چالش های موجود در بازشناسی اعمال انسان پیشنهاد شده است. به عبارت دیگر در این رساله دسته بند مقاوم نسبت به بعضی از چالش های گفته شده ارائه شده است. روش های پیشنهادی با مجموعه داده های متفاوتی مانند weizmann ، kth ، hollywood ، ucf101 ، extended yale b ، uci و ndc متناسب با نیاز ارزیابی روش بررسی شده و با روش های مشابه مقایسه گردیده اند. نتایج ازیابی بر روی مجموعه دادگان متفاوت، بیانگیر کارایی دسته بندهای پیشنهادی بوده است. همچنین با توجه به اینکه در مساله بهینه سازی روش های پیشنهادی از ایده کمترین مربعات بهره گرفته شده است، مساله بهینه سازی مرتبه دوم به مساله بهینه سازی خطی تبدیل شده و سرعت آموزش به صورت قابل ملاحظه ای افزایش پیدا کرده است.