نام پژوهشگر: آزاده بیرانوندبرجله

فیلترکردن هرزنامه ها با استفاده از تکنیک های یادگیری ماشین
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1390
  آزاده بیرانوندبرجله   علیرضا عصاره

امروزه با توجه به فراگیری استفاده از نامه های الکترونیکی مسأله ای به نام هرزنامه ها به وجود آمده که علاوه بر هدر دادن زمان کاربران، مشکلات دیگری از جمله تحت تاثیر قرار دادن پهنای باند و استفاده ی نادرست از فضای ذخیره سازی را به همراه دارد. لذا، طراحی سیستم های کارا جهت فیلترکردن موثر هرزنامه ها از اهمیت فوق العاده ای برخوردار است. در این پایان نامه، هدف تجزیه و تحلیل، طراحی و پیاده سازی یک سیستم کارا و انعطاف پذیر مقابله با هرزنامه ها مبتنی بر روش های آماری و یادگیری ماشین است. در این راستا، با توجه به پیچیدگی های ذاتی مسأله ی فیلترکردن هرزنامه ها و به کارگیری مستمر روش های بدیع توسط تولیدکنندگان هرزنامه ها جهت جلوگیری از تشخیص و شناسایی این گونه ایمیل ها، تاکید بر استفاده از معماری های چند لایه ای ترکیبی به جای دسته بندی کننده های منفرد است. ویژگی های سیستم پیشنهادی? فیلترکردن هرزنامه، عبارت های موجود در متن ایمیل ها بوده و از آنجا که تعداد این ویژگی ها بسیار زیاد است، یک روش ترکیبی انتخاب ویژگی به منظور پیدا کردن زیرمجموعه ی بهینه ی ویژگی ها به کار گرفته شده است. برای دسته بندی ایمیل ها یک روش ترکیبی مبتنی بر الگوریتم های درخت تصمیم، ماشین بردار پشتیبان و پرسپترون چندلایه معرفی شده و روی مجموعه داده ی lingspam پیاده سازی شده است. نتایج به دست آمده نشان دهنده ی کارایی بالای سیستم نسبت به دسته بندی کننده های منفرد است. صحت اندازه گیری شده برابر 99 درصد است.