نام پژوهشگر: سجاد ظریف زاده
مرضیه پارویی علی محمد زارع بیدکی
امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد موتورهای جستجو و بالا بردن اطمینان کاربران به آنها گردد. وب فریبکارانه پدیده ای است که پیدایش آن همزمان با ظهور وب بوده و در سا ل های اخیر بسیار شایع شده است. روش های مختلفی برای تولید صفحات فریب آمیز مورد استفاده قرار می¬گیرند اما همیشه با توجه به الگوریتم¬هایی که موتورهای جستجو برای رتبه¬بندی صفحات وب به کار می برند ترفندهای جدید فریبکاری ابداع می شود. فریبگرها از دو روش کلی فریبکاری مبتنی بر محتوا و فریبکاری مبتنی بر پیوند برای فریب موتورهای جستجو استفاده می کنند. در این پایان نامه ابتدا به معرفی روش ها و الگوریتم های مختلف تشخیص صفحات وب فریب آمیز می پردازیم. در نهایت روشی جدید جهت شناسایی صفحات فریب آمیز در گراف وب فارسی ارائه می گردد. این روش ترکیبی از روش های مبتنی بر محتوا و پیوند است و با بهره گیری از اطلاعات محتوا و پیوند، صفحات فریب آمیز را شناسایی می کند. این روش بر روی داده های موتور جستجوی فارسی پارسی جو پیاده سازی شده است و نتایج ارزیابی های صورت گرفته قبل از پیاده سازی این الگوریتم و پس از آن بهبودی برابر با 21.2% را در فاکتور دقت نشان می دهد.