نام پژوهشگر: سمیرا یگانه
سمیرا یگانه رضا عزمی
با پیشرفت سریع سامانههای هوشمند و افزایش حضور رایانهها در زندگی مدرن، تشخیص خودکار حرکات و حالتهای غیر کلامی کاربر مورد توجه زیادی قرار گرفته است. هدف از انجام این پژوهش، توسعه یک سامانه تشخیص حالت چهره است که قادر به تشخیص حالتهای احساسی پایه از روی تصاویر ساکن و از روی فریمهای متوالی باشد. یک سامانه آنالیز حالت چهره از سه بخش اصلی: آشکارسازی چهره، استخراج ویژگی چهره و تشخیص حالت چهره تشکیل میشود. در این پژوهش، محوریت با مرحله استخراج ویژگی بوده و برای بهبود روشهای موجود، سه تلاش مجزا صورت میگیرد. در استخراج ویژگیهای چهره، تاکید اصلی بر ترکیب کلی چهره و ویژگیهای مبتنی بر ظاهر است. یکی از ویژگیهای مبتنی بر ظاهر متداول، ویژگیهای گابور است که استخراج آن نیازمند محاسبات سنگینی میباشد. برای کاهش محاسبات در مرحله استخراج ویژگیهای گابور، روش rgfs برای انتخاب ناحیهای فیلترهای گابور ارائه میشود. این روش نسبت به روشهای پیشین که نگاهی سراسری به چهره دارند، از کارایی بالاتری برخوردار است. در تلاشی دیگر، برای تشخیص حالت چهره از روی تصاویری که بخشی از آنها پوشیده شده، سه نوع ویژگی مبتنی بر ظاهر گابور، الگوهای دودویی محلی (lbp) و الگوهای دودویی گابور محلی (lgbp) مورد ارزیابی قرار میگیرند. نتایج حاصل از ارزیابی، دقت و مقاومت بالای روش lgbp را تحت شرایط متنوع پوشیدگی نشان میدهد. بطوریکه میانگین دقت تشخیص در شرایط پوشیدگی گوناگون بر روی تصاویر پایگاه داده ck+ با استفاده از ویژگیهای گابور، lbp و lgbp به ترتیب برابر با 41/73%، 43/75% و 23/83% است و بر روی تصاویر پایگاه داده jaffe به ترتیب برابر با 49/78%، 85/84% و 22/90% است. البته این روش پیچیدگی محاسباتی بالایی دارد اما با استفاده از فیلترهای ناحیهای انتخاب شده توسط روش rgfs، پیچیدگی محاسباتی آن نیز کاهش یافته و به روشی کارا جهت استخراج ویژگی از روی تصاویر پوشیده تبدیل میگردد. در تلاشی دیگر، برای استخراج ویژگیهای حرکتی از روی رشته فریمهای کلیدی حالت چهره، روش تعقیب حرکات چهره بر اساس شار نوری متراکم بکار گرفته شده است. یکی از ایرادهای سیستمهای آنالیز قبلی این است که بردارهای حرکت حاصل از تعقیب پیکسلهای تصویر را به صورت مستقیم مورد استفاده قرار میدهند، در صورتیکه میتوان با ارائه توصیف سطح بالاتری از حرکت استخراج شده، اطلاعات شاخصتری را به عنوان ورودی در اختیار دستهبند قرار داد. بدین دلیل، در این پژوهش روش جدید الگوهای دودویی حرکت محلی (lmbp) برای استخراج الگوهای حرکتی از روی فریمهای متوالی ارائه میگردد. در روش lmbp، اندازه و زاویه حرکت بر اساس تصاویر خاکستری بصریسازی شده و سپس از عملگر lbp برای استخراج الگوهای حرکتی از سطح این تصاویر استفاده میشود. نتایج حاصل از ارزیابی این روش بر روی رشته فریمهای پایگاه داده ck+، کارایی این روش را بخوبی نشان میدهد. بطوریکه دقت تشخیص حالت چهره با استفاده از روش lmbp در مقایسه با روش gpt که در آن اندازه و زاویه حرکت حاصل از تعقیب یک شبکه از نقاط به عنوان ویژگی در نظر گرفته میشود و دقت آن 79/89% است، 37/4% افزایش مییابد.