نام پژوهشگر: آزاده بیرانوندبرجله
آزاده بیرانوندبرجله علیرضا عصاره
امروزه با توجه به فراگیری استفاده از نامه های الکترونیکی مسأله ای به نام هرزنامه ها به وجود آمده که علاوه بر هدر دادن زمان کاربران، مشکلات دیگری از جمله تحت تاثیر قرار دادن پهنای باند و استفاده ی نادرست از فضای ذخیره سازی را به همراه دارد. لذا، طراحی سیستم های کارا جهت فیلترکردن موثر هرزنامه ها از اهمیت فوق العاده ای برخوردار است. در این پایان نامه، هدف تجزیه و تحلیل، طراحی و پیاده سازی یک سیستم کارا و انعطاف پذیر مقابله با هرزنامه ها مبتنی بر روش های آماری و یادگیری ماشین است. در این راستا، با توجه به پیچیدگی های ذاتی مسأله ی فیلترکردن هرزنامه ها و به کارگیری مستمر روش های بدیع توسط تولیدکنندگان هرزنامه ها جهت جلوگیری از تشخیص و شناسایی این گونه ایمیل ها، تاکید بر استفاده از معماری های چند لایه ای ترکیبی به جای دسته بندی کننده های منفرد است. ویژگی های سیستم پیشنهادی? فیلترکردن هرزنامه، عبارت های موجود در متن ایمیل ها بوده و از آنجا که تعداد این ویژگی ها بسیار زیاد است، یک روش ترکیبی انتخاب ویژگی به منظور پیدا کردن زیرمجموعه ی بهینه ی ویژگی ها به کار گرفته شده است. برای دسته بندی ایمیل ها یک روش ترکیبی مبتنی بر الگوریتم های درخت تصمیم، ماشین بردار پشتیبان و پرسپترون چندلایه معرفی شده و روی مجموعه داده ی lingspam پیاده سازی شده است. نتایج به دست آمده نشان دهنده ی کارایی بالای سیستم نسبت به دسته بندی کننده های منفرد است. صحت اندازه گیری شده برابر 99 درصد است.