نام پژوهشگر: معصومه آدینه
معصومه آدینه علی یزدیان ورجانی
از جمله ناامنی های پست الکترونیک ایمیل های نا خواسته یا هرزنامه ها می باشند. برای شناسایی هرزنامه-ها بانک کلید واژه ها انتخاب می شود و کلید واژه های مورد نظر در ساختمان داده خاص خود ذخیره می-گردد. بعد از دریافت ایمیل رفتار ایمیل و محتوای آن بررسی می گردد. چون در اینجا محتوا متن است (فرض) به منظور کاهش بعد و رفع مشکل پراکندگی داده ها و افزایش کارایی متن خلاصه می شود؛ کلمات ریشه یابی شده و در یک بردار قرار می گیرد. بعد از آن به امتیازدهی بردارها با استفاده از قاعده پرداخته می شود. برای استخراج قواعد و دسته بندی متن از درخت تصمیم استفاده شده است. بعد از ارزیابی این نتیجه حاصل شد که ارتباط معناداری بین تعداد صفات خاصه و میزان کارایی سیستم موجود است. به این صورت که هر چه تعداد صفات خاصه انتخابی بیشتر باشد کارایی سیستم بالاتر است و همچنین هر چه تعداد صفات خاصه بیشتر باشد؛ نسبت نرخ خطای مثبت نادرست به میزان آستانه کمتر خواهد بودو نیز طبقه بندی به روش درخت تصمیم نسبت به طبقه بندی به روش بیزین ساده از دقت و کارایی بالاتری برخوردار است. کلمات کلیدی: هرزنامه / پست الکترونیک / درخت تصمیم / سیستم خبره / بیزین ساده