نام پژوهشگر: عسگرعلی بویر
عزیز کرمیانی عسگرعلی بویر
چکیده بینایی ماشین یکی از فیلدهای هوش مصنوعی است که با ترکیب علوم مختلف مانند ریاضیات، فیزیک، علوم مهندسی، کامپیوتر، فیزیولوژی و غیره سعی در درک هوشمند معنا از تصاویر محیط اطراف توسط کامپیوتر یا ماشین دارد. ردیابی اشیاء متحرک یکی از کاربردهای مهم بینایی ماشین است که نقشی اساسی را برای سیستم های سطح بالاتر بینایی مانند کنترل ترافیک، سیستم های نظارتی، تعامل انسان با کامپیوتر، ناوبری خودکار و بازشناسی بر اساس اطلاعات حرکت بازی می کند. در این پایان نامه دو روش را برای ردیابی اشیاء متحرک در حالت دوربین متحرک ارائه می کنیم. در هر دو روش و با توجه به اینکه حرکت دوربین یک چالش بزرگ در ردیابی اشیاء متحرک تلقی می شود، این حرکت را تشخیص داده و تاثیر آن را خنثی می کنیم. در روش پیشنهادی اول که به ردیابی چندین شی متحرک بصورت همزمان می پردازد ابتدا حرکت دوربین را با استفاده از اطلاعات اندازه و جهت حرکت نقاط ویژگی klt تشخیص داده و از میان نقاط متناظر، نقاط ویژگی که حرکتی مشابه به حرکت دوربین داشته باشند را از مجموعه نقاط ویژگی حذف کرده و بر این اساس نقاط ویژگی برای اشیاء متحرک بدست خواهند آمد. سپس با اجرای یک مرحله بهینه سازی و با استفاده از ویژگی شدت روشنایی یک مجموعه از نقاط ویژگی بهینه (ofpt) برای ردیابی را استخراج کرده که از این مجموعه نقاط ویژگی بهینه برای ردیابی اشیاء متحرک موجود در حوزه دید دوربین متحرک با استفاده از خوشه بندی k-means و بردار ویژگی شامل موقعیت، اندازه حرکت و جهت حرکت استفاده کردیم. در روش پیشنهادی دوم و برای ردیابی یک شی خاص در دنباله فریم های ویدئویی، ابتدا ناحیه شی مورد علاقه بصورت دستی در فریم اول انتخاب شده و ویژگی های بافت آن استخراج می شود. سپس ماتریس حرکت دوربین را با استفاده از خوشه بندی نقاط ویژگی klt به دو خوشه اشیاء متحرک و پس زمینه تشخیص داده و با استفاده از این ماتریس تاثیر منفی حرکت دوربین را خنثی می کنیم. در ادامه و با الگوریتم تفاضل فریم و با در نظر گرفتن یک حد آستانه پویا، نواحی مرتبط به اشیاء متحرک موجود در حوزه دید دوربین متحرک کشف می شوند. در نهایت با استفاده از الگوریتم خوشه بندی dbscan اشیاء متحرک را کشف کرده و از میان این اشیاء کاندید بهترین انطباق را بعنوان ناحیه شی بر اساس ویژگی های بافت استخراجی در گام نخست بدست می آوریم. نتایج آزمایشات نشان می دهد که هر دو روش پیشنهادی در این پایان نامه حرکت دوربین را بخوبی تشخیص داده و و با حذف حرکت دوربین اشیاء متحرک را بشکل مطلوبی ردیابی می کنند. از آنجایی که در هر دو روش از ویژگی های گوشه برای ردیابی استفاده می کنیم در نتیجه در حالت تغییرات روشنایی محیط نیز روش های پیشنهادی عمل ردیابی را بدرستی انجام می دهند. از نظر زمان پردازش نیز روش های پیشنهادی توانایی کار روی سیستم های نظارتی و زمان واقعی را دارند. کلمات کلیدی: ردیابی، دوربین متحرک، اشیاء متحرک، خوشه بندی k-means، خوشه بندی dbscan.