نام پژوهشگر: رامین رضوانی خراشادی زاده

ماشین بردار پشتیبان دوگانه ساختاری چگالی گرا برای مسائل خطی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی کامپیوتر 1393
  رامین رضوانی خراشادی زاده   رضا منصفی

الگوریتم ماشین بردار پشتیبان (svm)، به عنوان یکی از رایج ترین طبقه بندها، سعی در یافتن ابرصفحه ای می کند که دو کلاس از داده ها را با حداکثر حاشیه جدا کند. طبقه بندهای svm، بیشتر روی جداسازی بین کلاس ها تمرکز می کنند و توجه خاصی به استخراج ساختارهای درون داده های آموزشی نشان نمی دهند. درحالی که اخیرا کشف شده است که، اطلاعات ساختاری، به عنوان دانش پیشین ضمنی، نقش اساسی و حیاتی برای طراحی طبقه بندی خوب، در مسائل مختلف جهان طبیعی بازی می کند. اساسا، استفاده از اطلاعات ساختاری درون داده ها برای بهبود قابلیت تعمیم پذیری یک طبقه بند، کلاسی از طبقه بندهای حاشیه بزرگ ساختاری را معرفی می کند مانند ماشین حاشیه بزرگ ساختاری (structured large margin machine, slmm). اینکه چگونه اطلاعات ساختاری داده ها را برای ساختن طبقه بندی خوب اعمال کنیم، موضوع تحقیقاتی جدیدی است که اخیرا مورد توجه قرار گرفته است. همان طور که می دانیم، همه متدهای حاشیه بزرگ ساختاری (structural large margin) موجود، همه اطلاعات ساختاری درون کلاس ها را به درون یک مدل درنظر می گیرند. به عبارت دیگر، این متدها ارتباط اطلاعات ساختاری درون کلاسی و بین کلاسی را بالانس نمی کنند که سبب می شود این اطلاعات پیشین به طور کامل و کافی استخراج نشود. الگوریتم s-twsvm برای بهبود تعمیم پذیری متدهای مبتنی بر اطلاعات ساختاری معرفی شد و توانست مشکل تداخلات اطلاعات ساختاری بین دو کلاس را برطرف کند. اما در حل تداخلات و تناقض های بین اطلاعات ساختاری کلاسترهای یک کلاس ناتوان است و همچنین توانایی ممیزسازی داده های آموزشی از نقاط نویز را ندارد. در این نوشتار الگوریتمی با عنوان ماشین بردار پشتیبان دوگانه ساختاری چگالی گرا (dos-twsvm) معرفی می شود که با بهره بردن از قابلیت های s-twsvm، توانایی مدیریت کردن اطلاعات ساختاری درون کلاسی، به طوری که مسائل تداخلات اطلاعات ساختاری درون کلاسی را حل کند، دارا می‎ باشد. از طرف دیگر با تمایز کردن نقاط پرت و نویز از سایر نقاط آموزشی، قابلیت تعمیم پذیری را افزایش می دهد. در انتهای این نوشتار، الگوریتم پیشنهادی با الگوریتم s-twsvm، روی مجموعه داده ساختگی و داده های mnist و همچنین مجموعه داده های uci آزمایش می شود و برتری الگوریتم پیشنهادی از نظر صحت و دقت (accuracy) در طبقه بندی داده های تست، مشاهده می شود.