نام پژوهشگر: محسن دواچی
محسن دواچی محمد حسین یغمایی مقدم
هرزنامه ها که به عنوان پیام های الکترونیکی ناخواسته شناخته می شوند یک مشکل فزاینده برای امنیت اطلاعات شده اند. ورود بی اجازه هرزنامه ها باعث آزار کاربر شده و منابع شبکه را هدر می دهد. به طور سنتی یادگیری ماشین و سیستم های فیلترینگ آماری برای فیلتر کردن هرزنامه به کار می روند. گرچه روش منحصر به فردی که بتواند به طور موفقیت آمیز هرزنامه ها را رده بندی کند وجود ندارد. لازم است که روش های چندگانه ای برای شناسایی هرزنامه و فیلتر کردن کارآمد حجم روزافزون هرزنامه ها اعمال گردند. در این پایان نامه یک روش اجماع براساس الگوریتم استعماری ارائه شده است که از سه رده بند پایه ی درخت تصمیم cart ، شبکه عصبی چند لایه پرسپترون و ماشین بردار پشتیبان برای رده بندی هرزنامه استفاده می کند و در نهایت با استفاده از دو الگوریتم رقابت استعماری ica و وزن وینر به اجماع پاسخ های سه روش فوق پرداخته شده است و در نهایت این روش ها با یکدیگر مقایسه شده اند. دو بانک اطلاعاتی در این پایان نامه استفاده شده است که اولی بانک اطلاعاتی spambase و دیگری بانک اطلاعاتی trec2007 است. در بانک اطلاعاتی trec2007 ابتدا چهار هزار ایمیل، 2000 هرزنامه و 2000 ایمیل معتبر به صورت تصادفی انتخاب گردید و سپس به استخراج ویژگی از آنها پرداخته شد و در نهایت ویژگی های بدست آمده با استفاده از الگوریتم تشخیص مولفه اصلی کرنلی (kpca) به پنجاه و هفت عدد کاهش داده شدند. این دو بانک اطلاعاتی به مدل پیشنهادی اعمال گردید و در نهایت به این نتیجه رسیده شد که اجماع روش های فوق نتیجه بهتری نسبت به تک تک الگوریتم ها دارد.