نام پژوهشگر: ملیحه میری علی اباد

ارزیابی و بهبود عملکرد روش های مبتنی بر نمایش تنک در مسائل پیچیده طبقه بندی داده ها
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1392
  ملیحه میری علی اباد   محمد تقی صادقی

طی دهه اخیر، پردازش تنک سیگنال ها به عنوان ابزاری قدرتمند و جایگزینی کارا برای تبدیل های کلاسیک، توجه زیادی را به خود جلب کرده است. استفاده از نمایش تنک سیگنال ها در مسائل طبقه بندی نیز نتایج موفقیت آمیزی به همراه داشته است. با این حال، کیفیت عملکرد این طبقه بندی کننده ها در شرایط سخت، از جمله در مواردی که داده های هر طبقه تنوع زیادی داشته و یا ابعاد داده ها در مقایسه با تعداد داده های آموزشی زیاد باشد، به شدت افت می کند. علاوه بر این، پیچیدگی محاسباتی بالای برخی از این روش ها، استفاده از آن ها را در بسیاری از کاربردهای عملی با مشکل مواجه می کند. برای کاهش این مشکلات، روش های مختلفی ارائه شده است که از آن جمله می توان به توسعه الگوریتم های آموزش دیکشنری طبقه بندی گرا و همچنین معرفی روش هایی برای انتخاب تعداد کمی از اتم های دیکشنری که نمایش متمایزکننده تری از سیگنال مورد نظر ارائه می دهند، اشاره کرد. در این پژوهش، مسائل پیچیده طبقه بندی دادگان با استفاده از طبقه بندی کننده های مبتنی بر نمایش تنک، با به کارگیری روش های آموزش دیکشنری و همچنین ارائه ی روش جدیدی تحت عنوان طبقه بندی دو مرحله ای مورد توجه قرار گرفته است. برای ارزیابی عملکرد روش ها، از دو پایگاه داده 14-tumors و lfw استفاده شده است. دادگان 14-tumors حاوی مقادیر بیان ژن در 14 نوع تومور مختلف می باشد که ابعاد بسیار بالایی در مقایسه با تعداد نمونه ها دارد. شرایط کنترل نشده تصاویر چهره lfw نیز منجر به عملکرد ضعیف روش های معمول، در تفکیک زوج های سازگار و ناسازگار آن شده است. مقایسه ی نتایج شبیه سازی ها، حاکی از عملکرد بهتر روش طبقه بندی دو مرحله ای پیشنهادی در دادگان 14-tumors، با صحت تقریبی 80 درصد است. همچنین، استفاده از دیکشنری های مجزا برای هر یک از تصاویر زوج ورودی، به دسته بندی نسبتا بهتر زوج های سازگار و ناسازگار در پایگاه داده lfw منجر شده است.