نام پژوهشگر: محبوبه قاسم پور
محبوبه قاسم پور هادی صدوقی یزدی
مشکلات موجود در طبقه بند جداساز خطی (lda) از قبیل حساسیت به داده های پرت، فرض اولیه تک مدی بودن توزیع کلاس ها و معکوس ناپذیری ماتریس پراکندگی داخل کلاس انگیزه ای برای ارائه طبقه بندی جدید در این طرح شد. البته در تحقیقات گذشته راهکارهایی همچون استفاده از گراف همسایگی، استفاده از نرم یک و وزنی نمودن طبقه بند برای کاهش حساسیت به داده های پرت، روش هایی مانند کاهش ابعاد، بکارگیری پارامتر تنظیم ساز و تغییر در تابع هزینه lda جهت حل مشکل معکوس ناپذیری و راه حل استفاده از ناحیه همسایگی برای مشکل تک مدی بودن ارائه شده اند. در تمام موارد فوق وجود چگالی داده ها در ساختار طبقه بند جداساز خطی از نظر دور مانده است. در این طرح برآنیم با افزودن چگالی داده ها به طبقه بند lda آن را در مقابل مشکلات تاثیر داده های پرت و معکوس ناپذیری مقاوم کنیم. علاوه بر آن، توانایی طبقه بندی مجموعه داده های غیرخطی و چند مدی را داشته باشد. همچنین با به کارگیری تکنیک ترکیب طبقه بندها مانند آدابوست، طبقه بند پیشنهادی را برای طبقه بندی مجموعه داده های حجیم توانمند ساختیم. جهت انجام آزمایش از مجموعه داده های مصنوعی، کوچک، متوسط و بزرگ از جمله مجموعه داده nslkdd که در تشخیص نفوذ کاربرد دارد، بهره بردیم. نتایج نشان می دهد طبقه بند پیشنهادی مشکلات lda را به خوبی حل می کند و مجموعه داده های غیر خطی و حجیم را طبقه بندی می نماید.