نام پژوهشگر: مریم بیگ زاده

پردازش تصویر به منظور تعقیب حرکت چشم برای کمک به افراد ناتوان در اجرای کامپیوتری فرامین
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی 1387
  مریم بیگ زاده   منصور وفادوست

بیش از سی سال است که سیستم های تعقیب حرکت چشم به منظور برقراری ارتباط بین افراد ناتوان حرکتی و کامپیوتر، طراحی و روانه بازار شده اند. در یک سیستم تعقیب گر حرکت چشم، کاربر در مقابل یک صفحه نمایش قرار می گیرد و یک (یا چند) دوربین ویدیویی از چشمان وی تصویربرداری می کند. دنباله تصاویر به دست آمده، برای تخمین مسیر نگاه کاربر پردازش می شود. تعقیب گرهای تجاری موجود در بازار، به دلیل استفاده از دوربین های حساس به مادون قرمز و دارای قابلیت بزرگنمایی زیاد، بسیار گران قیمت بوده و قیمتی بین چند هزار تا چند ده هزار دلار دارند. از طرفی، در این سیستم ها به منظور کنترل شرایط نورپردازی و استفاده از ویژگی خاص مردمک در برابر اشعه مادون قرمز از نورپردازی ویژه ای استفاده می شود. بسیاری از شرکتهای تولید کننده دستگاه های تعقیب چشم به دنبال بررسی راه هایی هستند که امکان استفاده از تکنولوژی ارزان قیمتی را در شرایط نوری معمولی فراهم نماید. در این پروژه سیستم ارزان قیمتی مبتنی بر وب کم طراحی شده است که در شرایط نوری معمولی تصویر برداری می کند و نیازی به نصب سخت افزار بر روی سر کاربر ندارد و دوربین بر روی میز و در مقابل کاربر قرار می گیرد. هدف این پروژه، ارایه روشی به منظور بالا بردن دقت و کاهش قیمت تعقیب گر طراحی شده، با هدف کمک به افراد ناتوان حرکتی در کار با کامپیوتر است. تعقیب گرهایی که از کل چهره تصویربرداری می کنند، نیاز به انجام مراحل پردازشی متعددی دارند که عبارتند از تشخیص موقعیت چهره در تصویر، تشخیص محل اجزاء چهره (چشم ها و لبها و ...) تشخیص نقاط مشخصه ای مانند مختصات مرکز مردمک، گوشه های چشم، روش های مطرح در زمینه تشخیص و تعقیب چهره و اجزاء آن به دو دسته سرتاسری و محلی (سلسله مراتبی) تقسیم می شوند و در هر مورد ایده های مختلفی وجود دارد. در این پروژه دو روش محلی و سرتاسری، پیاده سازی و نتایج آنها با یکدیگر مقایسه شده است. همچنین برای ایجاد نگاشت از فضای تصویر به مختصات مورد نظر روی نمایشگر از دو شبکه عصبی پرسپترون با یک لایه پنهان استفاده شد که ویژگی های در نظر گرفته شده و مدل تتعلیم یافته موفق شد به دقت تشخیص 6.52 درجه دست یابد. این در حالی است که نمونه های مشابه مبتنی بر وب کم دقت های حدود 8 درجه را گزارش کرده اند. مجموعه دادگان مورد استفاده در این پروژه عبارت است از دنباله های ویدیویی ضبط شده از 10 فرد مختلف که هر یک در شرایط خاصی (به فاصله 60 سانتی متری و در نمای رو به رو) نسبت به دوربین و نمایشگر قرار گرفته اند و به نقاط خاصی از صفحه نمایش نگریسته اند. در مورد یکی از افراد، علاوه بر نمای رو به رو، دادگانی از دوران های مختلف سر نیز ثبت شده تا مقاومت روش را به تغییر وضعیت سر نیز نشان دهد.