نام پژوهشگر: ناصر نوراشرف الدین

تشخیص بی درنگ حرکات دست در تعامل انسان با کامپیوتر
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386
  ناصر نوراشرف الدین   رضا صفابخش

در سالهای اخیر تحقیقات زیادی برای استفاده از ابزارها و روش های جدید برای ارتباط با کامپیوتر انجام شده است. در حال حاضر برای برقراری ارتباط با وسایلی مانند کامپیوتر، رباتها و یا سایر وسایل الکترونیکی نظیر تلویزیون از ابزارهای واسطی مانند موشواره و صفحه کلید، اهرمهای مکانیکی و الکتریکی و یا کنترلهای از راه دور استفاده می شود. با پیشرفت فناوری در آینده نزدیک شاهد خواهیم بود که انسانها بسیاری از کارهای روزمره خود را با استفاده از این وسایل انجام می دهند و بنابراین اگر بتوانند با این وسایل به همان شیوه ای که انسانها با یکدیگر تعامل دارند، ارتباط برقرار کنند، کارها بسیار راحت تر و بدون نیاز به ابزارهای واسط قابل انجام خواهد بود. در این پایان نامه یک الگوریتم مبتنی بر بینایی ماشین ارایه شده است که می تواند بصورت بی درنگ حرکتهای دست کاربران را تشخیص داده و معادل دستوری آنها را در کامپیوتر اجرا کند. در ابتدا با استفاده از روش تفاضل پس زمینه، تصویر کاربر از زمینه جدا و سپس با استفاده از یک مدل گاسی، پیکسلهایی که به رنگ پوست انسان هستند مشخص می شوند. از ویژگی های مهم الگوریتم پیشنهادی که برتری آن نسبت به سایر الگوریتم های ارایه شده نیز بشمار می رود، عدم نیاز به داشتن تصویر زمینه از قبل می باشد. در این روش الگوریتم خود از روی فریمهای اولیه تصویر زمینه را می سازد و در فریمهای بعدی آن را بروزرسانی می کند. در مرحله بعد با استفاده از عملگرهای ریخت شناسی نویزهای تصویر و ناحیه های آویزان دست حذف می شود. پس از تقطیع دستها، کف دست از بقیه قسمتهای آن مانند ساعد و بازوها جدا می شود. برای شناسایی دستها با استفاده از گشتاورهای مرکزی نرمال شده و گشتاورهای پیرامون، بردار ویژگی هر دست استخراج شده و این بردارهای ویژگی به عنوان ورودی به شبکه های lvq داده می شوند که این شبکه ها نوع حرکت کاربر را تشخیص می دهند. کلیه حرکتهای این سامانه ایستا بوده و کاربران حرکتها را با دو دست انجام می دهند. این الگوریتم می تواند 25 حرکت مختلف را که توسط پنج وضعیت پایه انجام می شود را با سرعت 5/2 فریم در ثانیه شناسایی کند. الگوریتم ارایه شده می تواند در حالت برون خط با دقت 6/97 و درحالت برخط با دقت 94 درصد حرکتهای کاربران را تشخیص دهد. در این الگوریتم مشکل همپوشانی صورت و دستهای کاربر حل شده و برای نور محیط هیچ نورپردازی خاصی در نظر گرفته نشده و سامانه می تواند در نورپردازی های مختلف کار کند.