نام پژوهشگر: معین شهبازی
معین شهبازی علی محمد زارع بیدکی
با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مقابله با صفحات فریب آمیز ارائه شده اند که به دو دسته کلی الگوریتم های براساس محتوا و الگوریتم های براساس پیوند تقسیم می شوند. دسته اول با تجزیه و تحلیل محتوای اسناد توانایی تشخیص و مقابله با صفحات فریب آمیز را دارند. همچنین در دسته دوم با تجزیه و تحلیل پیوند و رفتار بین صفحات عمل مقابله و تشخیص انجام می شود. مشکل اصلی الگوریتم های مبتنی بر محتوا، نادیده گرفتن پیوندهای بین صفحات است. در مقابل در الگوریتم های براساس پیوند تشخیص الگوهای غیرطبیعی در میان گراف های بزرگ از چالش های این الگوریتم ها است. هدف اصلی این پایان نامه، ارائه یک روش رتبه بندی ترکیبی به منظور مقابله با صفحات فریب آمیز است. در این روش با ترکیب الگوریتم های مختلف رتبه بندی سعی می شود رتبه صفحات فریب آمیز پایین کشیده شود. با توجه به کارایی پایین روش های پایه ای موجود در مقابله با این پدیده روش پیشنهادی سعی می کند با دخیل کردن یادگیری ماشین در فرآیند رتبه بندی بهبود نسبی در کارایی روش مبنا بوجود می آید. در این روش سعی می شود هر چه بیشتر پویایی گراف وب با استفاده از روش های یادگیری مدل شود. فرآیند یادگیری جهت ترکیب رتبه های مختلف با استفاده از مشاهدات و دانش قبلی می باشد که در این حالت روش پیشنهادی دارای کارایی و دقت بیشتری نسبت به روش موجود می باشد.