نام پژوهشگر: سمانه عمودی
سمانه عمودی امیدرضا معروضی
با توجه به هدف اصلی اشتراک دادهها ، وب نقش مهمی در مسائل فرهنگی - آموزش وتجاری دارد . وبلاگ به عنوان یک نوع شبکه اجتماعی، به طور گسترده در سالهای اخیر استفاده شده است. نظرات ، بخش اصلی وبلاگ و شاخص خوبی برای نمایش اهمیت آن هستند و با توجه به محبوبیت وبلاگ نویسی اسپم وبلاگ، به یکی از منابع رایج اسپم تبدیل شده است. با توجه به مطالعات اندکی که در حوزه اسپم شناسی در وبلاگ های فارسی وجود دارد، در این پژوهش ما بر آن شدیم ضمن مرور کوتاه بر تحقیقات انجام شده در زمینه شناسایی اسپم به طراحی سیستمی جهت شناسایی اسپم نظرات در وبلاگ های فارسی با استفاده از معیار تشابه جاکارد بین نظرات و پست – نظرات به عنوان ویژگی های محتوایی به همراه معیارهایی چون طول نظرات ، تعداد لینک ها، تعداد ایست واژه ها به عنوان ویژگی های غیرمحتوایی در نظرات ارسالی کاربران و ارزیابی آن با چند مدل داده کاوی از جمله درخت تصمیم، naïve bayes و شبکه های عصبی بپردازیم