نام پژوهشگر: محمدرضا دهقانی محمودآبادی
محمدرضا دهقانی محمودآبادی علی محمد زارع بیدکی
امروزه به دلیل حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهم ترین چالش در بازیابی اطلاعات وب، خصوصاً موتورهای جستجو، رتبه بندی نتایج در پاسخ به پرس و جوی کاربر است. تاکنون الگوریتم های متنوعی که مبتنی بر محتوا و اتصال می باشند ارائه شده اند. علاوه بر روش های سنتی، روش های نوینی با عنوان روش های یادگیری جهت رتبه بندی مطرح شده است که به طور خلاصه عبارت است از ایجاد یک مدل خودکار رتبه بندی بر اساس داده های آموزشی به نحوی که این مدل قادر به مرتب سازی اسناد جدید بر اساس درجه مرتبط بودن آن ها با پرس وجوهای کاربران، میزان اهمیت اطلاعات اسناد و فاکتورهای دیگری از این قبیل باشد. در این پایان نامه ابتدا به معرفی رویکردهای اصلی روش های یادگیری جهت رتبه بندی پرداخته و در ادامه به بررسی تعدادی از الگوریتم های رتبه بندی به روش یادگیری مبتنی بر رویکرد جفتی می پردازیم. در نهایت روشی جدید جهت رتبه بندی صفحات وب مبتنی بر روش یادگیری جفتی ارائه می گردد. این روش، ترکیبی از روش های رتبه بندی svm و rankboost می باشد و برای رتبه بندی از روش svmprimal به عنوان یادگیرنده ضعیف در الگوریتم رتبه بندی rankboost استفاده می کند. این روش بر روی مجموعه داده trec2004 پیاده سازی شده است و نتایج ارزیابی های صورت گرفته، بهبود 10% نسبت به الگوریتم rankboost و بهبود 38% نسبت به الگوریتم svmprimal بر اساس معیار دقت را نشان می دهد.