ارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر
- نویسنده مرضیه پارویی
- استاد راهنما علی محمد زارع بیدکی سجاد ظریف زاده
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1393
چکیده
امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد موتورهای جستجو و بالا بردن اطمینان کاربران به آنها گردد. وب فریبکارانه پدیده ای است که پیدایش آن همزمان با ظهور وب بوده و در سا ل های اخیر بسیار شایع شده است. روش های مختلفی برای تولید صفحات فریب آمیز مورد استفاده قرار می¬گیرند اما همیشه با توجه به الگوریتم¬هایی که موتورهای جستجو برای رتبه¬بندی صفحات وب به کار می برند ترفندهای جدید فریبکاری ابداع می شود. فریبگرها از دو روش کلی فریبکاری مبتنی بر محتوا و فریبکاری مبتنی بر پیوند برای فریب موتورهای جستجو استفاده می کنند. در این پایان نامه ابتدا به معرفی روش ها و الگوریتم های مختلف تشخیص صفحات وب فریب آمیز می پردازیم. در نهایت روشی جدید جهت شناسایی صفحات فریب آمیز در گراف وب فارسی ارائه می گردد. این روش ترکیبی از روش های مبتنی بر محتوا و پیوند است و با بهره گیری از اطلاعات محتوا و پیوند، صفحات فریب آمیز را شناسایی می کند. این روش بر روی داده های موتور جستجوی فارسی پارسی جو پیاده سازی شده است و نتایج ارزیابی های صورت گرفته قبل از پیاده سازی این الگوریتم و پس از آن بهبودی برابر با 21.2% را در فاکتور دقت نشان می دهد.
منابع مشابه
رتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز
با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مق...
15 صفحه اولارائه روشی جهت ارزیابی صحت عملکرد کیت تشخیص انتروباکتریاسه
یکی از مهمتین گروه های باکتری گرم منفی، خانواده انتروباکتریاسه است که به منظور تشخیص آن آز روش های مختلفی نظیر تست های لوله ای و همچنین روش های نوین آزمایشگاهی این امر محقق می شود. با این وجود، با توجه به مشکلاتی روش های سنتی کشت لوله ای همچون هزینه نیروی انسانی، مالی و زمانی که برای آماده سازی محیط کشت، آلودگی های میکروبی، دشواری ساخت محیط های کشت مختلف و ... استفاده از روش های نوین آزمایشگ...
متن کاملارائه روشی برای پیشپردازش تصویر جهت بهبود عملکرد JPEG
A lot of researchs have been performed in image compression and different methods have been proposed. Each of the existing methods presents different compression rates on various images. By identifing the effective parameters in a compression algorithm and strengthen them in the preprocessing stage, the compression rate of the algorithm can be improved. JPEG is one of the successful compression...
متن کاملبهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش ...
متن کاملارائه روشی برای پیش پردازش تصویر جهت بهبود عملکرد jpeg
تاکنون کارهای زیادی در مورد فشرده سازی تصویر انجام گرفته و روشهای متفاوتی ارائه شدهاند. هر یک از این روشها بر روی تصاویر مختلف، میزان فشردهسازی متفاوتی را ارائه میدهند. با شناسایی پارامترهای تاثیرگذار در یک الگوریتم فشردهسازی و تقویت آنها در مرحله پیشپردازش، میزان فشردهسازی آن الگوریتم را میتوان بهبود بخشید. jpeg یکی از روشهای فشردهسازی موفق میباشد که کارهای زیادی نیز برای بهبود عمل...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023