نام پژوهشگر: عباس زهره وند

بازشناسی و مکان یابی اشیا در صحنه های پیچیده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق و کامپیوتر 1392
  عباس زهره وند   علیرضا احمدی فرد

در این پایان¬نامه روشی برای بازشناسی و مکان¬یابی اشیا در صحنه¬های پیچیده(شلوغ) ارائه شد. یکی از مهمترین و ابتدایی ترین مراحل در بینایی ماشین ، بازشناسی اشیا می¬باشد. اگر این فرآیند به درستی و با قابلیت اطمینان انجام نشود مراحل بعدی به درستی صورت نمی¬گیرد. روش پیشنهاد شده در نهایت ترکیبی از دو روش موجود می¬باشد. هر دو روش موجود از یک فرآیند آرام¬سازی احتمالاتی برای تطبیق استفاده می¬کنند. این دو روش ابتدا با استفاده از توصیفگر sift نقاط کلیدی را برای صحنه و مدل بدست آورده و سپس با استفاده از تعریف همسایگی، از نقاط بدست آمده یک گراف می¬سازند. هر نود در گراف ساخته یکی از همان نقاط کلیدی است. این گراف سپس با استفاده از دو ویژگی توصیف می¬شود. ویژگی یکانی که برای توصیف هر نود به تنهایی استفاده شده و همان بردار 128 تاییsift می¬باشد. ویژگی باینری برای توصیف همسایگی دو نود استفاده می¬شود. برای ویژگی باینری از ویژگی-های مقیاس و جهت استخراج شده توسطsift استفاده می¬شود. برای بررسی تحمل دو روش تطبیق از یک سو و همچنین تعیین دقیق پارامترهای مسئله تطبیق، یک محیط شبیه سازی ساخته شد. در ادامه اتفاقات متداول دنیای واقعی در این محیط شبیه سازی شد. سپس تحمل دو روش تطبیق در این محیط شبیه سازی مورد ارزیابی قرار گرفت. حاصل این ارزیابی نشان¬داد که روش اول با استراتژی نود ساختگی پوچ عملکرد بهتری نسبت به روش دوم داشت. از طرفی وقتی نویز به صحنه وارد می¬شد روش دوم عملکردی بهتری داشت. هردو روش زمانیکه قدرت نویز از یک آستانه فراتر می¬رفت دچار یک آشوب می¬شوند لذا نرخ بازشناسی خوبی بالایی نداشتند. در این حالت روش اول از آنجا که به دلیل وجود نویز هیچ مشاهده قابل اعتمادی وجود نداشت تمامی نودها را به سمت نود پوچ میل می¬داد. در نهایت چندین سناریوی واقعی ترتیب داده شد و دو روش تطبیق در این سناریوها مورد ارزیابی قرار گرفت. همانظور که انتظار می¬رفت روش اول قابلت اطمینان(منظور از قابلیت اطمینان تعداد تطبیق¬های اشتباه کمتر می¬باشد) بیشتری نسبت به روش اول داشت. اما روش دوم تعداد تطبیق¬های درست بیشتری را پیدا می¬کرد. برای استفاده از ویژگی¬های مناسب دو روش، یعنی قابلیت اطمینان بالا در کنار نرخ بازشناسی بالا ترکیب دو روش پیشنهاد شد. روش پیشنهادی نه تنها قابلیت اطمینان بالاتری نسبت به دو روش اول و دوم داشت، بلکه نسبت به هردو روش نرخ باز شناسی بالاتری داشت.