نام پژوهشگر: علی رضا سیدین
حمیدرضا برادران کاشانی علی رضا سیدین
مدلسازی پس زمینه اولین گام مهم در استخراج اطلاعات در بسیاری از کاربردهای پردازش ویدئو می باشد. دقت بالا در این مرحله منجر به نتایج مطلوبتر در مرحله آشکارسازی شیء متحرک و همچنین مراحل بالاتر پردازش ویدئویی می شود. البته تغییرات ذاتی در پس زمینه ویدئویی مانند امواج آب، شاخ و برگ های متحرک، تغییرات تدریجی روشنایی، حضور اشیاء متحرک در بیشتر زمان ها، لرزش دوربین و تغییرات ناگهانی در روشنایی صحنه این مسأله را به یک موضوع چالش برانگیز تبدیل کرده است. در این پایان نامه سه راهکار جدید برای حل مسأله مدلسازی پس زمینه و آشکارسازی شیء متحرک پیشنهاد می شود. در روش اول با کمک الگوریتم تقریب تابع جدیدی مبتنی بر فضای کرنل وزن دار شده با عنوان wkla به حل مسأله مذکور از دیدگاه تخمین تابع پس زمینه می پردازیم. در روش دوم با استفاده از یک الگوریتم طبقه بندی تک کلاسی مبتنی بر wkla با عنوان oc-wkla مسأله مدلسازی پس زمینه را از دیدگاه طبقه بندی تک کلاسی داده های پس زمینه ای مورد بررسی قرار می دهیم. در نهایت راهکار سوم نیز با کمک یک الگوریتم یادگیری لحظه ای مبتنی بر مفهوم طبقه بند های شبکه عصبی کمینه- بیشینه فازی با عنوان fmmbm ارائه می شود. نتایج ارزیابی های کیفی و کمی بر روی دنباله های ویدئویی متفاوت در مقایسه با روش های پیشین نشان دهنده ی توانایی بالای راهکارهای پیشنهادی در مدلسازی صحنه هایی شامل پس زمینه های متحرک، تغییرات تدریجی روشنایی و نویزهای شدید صحنه ای می باشد. علاوه بر حل مسائل فوق، ویژگی هایی چون حل مسأله پس زمینه غیرخالی در wkla، استفاده از یکنواختی مکانی در oc-wkla و قابلیت یادگیری و به روزرسانی لحظه ای در fmmbm از مشخصه های منحصربفرد هر روش پیشنهادی می باشد.
مجید داوودی علی رضا سیدین
در این تحقیق پس از معرفی مهمترین و کارآمدترین طبقه بندهای پایه و بحث در مورد اصول و مبانی نظری و تئوری ترکیب طبقه بندهای چندگانه، سه روش پیشنهادی جدید برای ترکیب نتایج طبقه بندهای چندگانه معرفی شده است که عبارتند از روش قانون ترکیب مشورتی، روش ترکیب بیشینه ساز امید و ترکیب کننده انتگرال فازی نرم-کمینه-بیشینه. جهت بررسی این سه روش چهار طبقه بند پایه که برای تشخیص کشتی در تصاویر استفاده می شوند به کار برده شده اند. یکی از آنها با استفاده از روش تطبیق قالب ها پیاده سازی شده است و سه دیگر نیز سه شبکه عصبی هستند که بر روی یک مجموعه ویژگی استخراج شده از تصاویر حاوی کشتی آموزش دیده اند. با استفاده از معروفترین و متداول ترین روش های موجود برای ترکیب طبقه بندها و همچنین سه روش پیشنهادی، خروجی این چهار طبقه بند با هم ترکیب شده و نتایج حاصل از آنها با هم مقایسه شده است. روش قانون ترکیب مشورتی که از ایده مشورت بین طبقه بندها بهره می برد، در دسته ترکیب کننده های آگاه از طبقه و آموزش ناپذیر می گنجد. روش ترکیب بیشینه ساز امید روشی است مبتنی بر الگوریتم em و مخلوط گوسی ها. این روش از ایده یافتن الگوهای تصمیم گیری مشابه در مجموعه طبقه بندها بهره می برد. معرفی یک انتگرال فازی جدید و استفاده از آن در ترکیب طبقه بندهای چندگانه سومین روش پیشنهادی در این تحقیق می باشد. این انتگرال فازی دو پارامتر آزاد برای طراح فراهم می کند که با استفاده از آنها می تواند دقت ترکیب کننده را برای کاربردهای خاص بهبود بخشد. نتایج شبیه سازی ها با استفاده از زبان برنامه نویسی c++، نشان می دهند که سه روش پیشنهادی و نسخه های متفاوت هر کدام در موارد زیادی می توانند بهتر از دیگر ترکیب کننده های موجود در ترکیب نتایج طبقه بندهای چندگانه عمل کنند. در این تحقیق شاهد افزایش بیش از چهار درصدی در دقت ترکیب کننده ها نسبت به بهترین دقت به دست آمده در بین ترکیب کننده های موجود بودیم.