نام پژوهشگر: محسن سرداری زارچی
محسن سرداری زارچی امیرحسن منجمی
خواب آلودگی راننده یکی از مهمترین عوامل تصادفات جاده ای می باشد. به همین دلیل اخیرا تحقیقات زیادی برای تشخیص آن انجام گرفته است. روش های تشخیص خواب آلودگی را می توان بر اساس نوع نشانه هایی که استفاده می کنند، به سه گروه روش های مبتنی بر علائم فیزیولوژی، مبتنی بر عملکرد خودرو، و مبتنی بر وضعیت و ظاهر شخص تقسیم نمود. از بین این سه گروه، روش های مبتنی بر وضعیت و ظاهر، به علت نداشتن مزاحمت برای راننده و تشخیص سریع، برای پیاده-سازی در داخل خودرو مناسب تر می باشند.تغییرات چشم، از مهمترین و دقیقترین نشانه هایی است که به هنگام خواب آلودگی در وضعیت و ظاهر راننده قابل مشاهده است. به همین دلیل در این پژوهش سعی شده است با تصویر برداری از صورت راننده و بررسی باز و بسته بودن چشم در دنباله تصاویر، خواب آلودگی راننده تشخیص داده شود. به منظور تصویر برداری از دوربین حساس به اشعه ی مادون قرمز استفاده شده است تا در رانندگی های شبانه، عمل تصویر برداری به نحو مطلوب انجام شود. در تصاویر حاصل از تصویر برداری مادون قرمز می توان با کمک سخت افزاری ویژه، مردمک چشم را به صورت خاصی برجسته نمود. ما از این نکته بهره برده و تصویر برداری از صورت راننده را انجام داده ایم. سپس با استفاده از تکنیک های پردازش تصویر و بینایی ماشین نواحی ای که کاندید چشم بودند را استخراج نمودیم. جهت تشخیص چشم و وضعیت آن از سه دسته ویژگی بافتی، مکانی و آنالیز مولفه-های اصلی استفاده شده است. با استخراج ویژگی ها، به کلاسه بندی نیاز داریم تا با استفاده از ویژگی های بدست آمده، عمل شناسایی چشم را از بین کاندید ها انجام دهد. در این راستا، شبکه عصبی پرسپترون سه لایه برای این امر بکار گرفته شد. ساختار شبکه و نحوه اعمال ویژگی ها به آن، نکته مهمی است که در مورد شبکه های عصبی باید مد نظر قرار گیرد. از این رو ما ابتدا به ازای هر دسته ویژگی چندین ساختار که در تعداد نرون های لایه پنهان متفاوت بودند را آموزش داده و سپس تست نمودیم که بیشترین درصد تشخیص صحیح با استفاده از ویژگی های مکانی، بافتی و آنالیز مولفه های اصلی به ترتیب 91/90، 90/62 و 91/57 بدست آمد. در آزمایشی دیگر برای رسیدن به دقت بالاتر، تمام ویژگی ها را تحت یک بردار ویژگی به یک شبکه عصبی اعمال نموده، مراحل آموزش و تست را انجام دادیم اما کارایی شبکه عصبی بر خلاف انتظار افزایشی پیدا نکرد. با مشاهده این رفتار از شبکه، به نظر می رسید که مفهوم کلاسه بند چندگانه در این مورد می تواند کارآمد باشد. در ساختار طراحی شده برای کلاسه بند چند گانه از سه شبکه عصبی که هر یک برای یک دسته از ویژگی ها در نظر گرفته شده بودند، بطور موازی استفاده می شود. خروجی این کلاسه بند جدید با استفاده از رای گیری وزن دار به صورت احتمالی بیان می شود که میزان آن نشان دهنده ضریب اطمینان شبکه می باشد. با این ایده ما توانستیم درصد تشخیص صحیح را نسبت به بالاترین مقدار بدست آمده در مراحل قبل به میزان 3/24 افزایش داده و به 95/14 برسانیم