نام پژوهشگر: سارا شهنازینیا
سارا شهنازی نیا احمد فراهی
یکی از موضوعات تحقیقی مهم، تنوع نتایج جستجو در وب می باشد. در موتورهای جستجو پیشرفته به دلیل محدودیت های زمان پاسخ پرس وجوها، دو فاز رتبه بندی به کار گرفته می شود. در فاز اول، از اسناد مرتبط با مجموعه ورودی، به صورت نا دقیقی زیر مجموعه کوچکی انتخاب می شود. در فاز دوم، اسناد کاندید مجدداً به وسیله معماری سیستم های یادگیری ماشین دقیق و پیچیده، رتبه بندی می شوند. رتبه بندی پایانی به وسیله رتبه های اسناد محاسبه شده در فاز دوم تعیین می شود. معماری های رتبه بندی سیستم های یادگیری ماشین مبتنی بر مجموع های افزایشی می باشند، بطوریکه رتبه های زیادی به صورت پی در پی در یک زنجیر اجرا می شوند و نتایج رتبه ها برای محاسبه کردن رتبه سند پایانی اضافه می شوند. در مورد پرس و جوهای مبهم نیاز است که موتور جستجو یک مجموعه از نتایجی را تولید نماید که تا حد امکان تمامی تفسیرهای مختلف از یک پرس و جو را پوشش دهد. واسط های کاربر زیادی برای نشان دادن نتایج جستجو هنگام مواجه شدن با پرس و جوهای مبهم ارائه شده اند که به کاربران در پیدا کردن اطلاعات صحیحی که جستجو می کنند، کمک می کنند. تحقیقات انجام شده، روی صحت و دقت، تنوع نتایج بازیابی شده صورت گرفته است. هدف ما ارائه معماری است که بتواند سیستم های یادگیری ماشین و فرایند تنوع نتایج بازیابی شده را در زمان پردازش پرس و جو تجمیع نماید. با انجام این کار، سرعت تنوع نتایج بازیابی شده را هنگام مواجه شدن با پرس و جوهای مبهم افزایش می دهیم. در معماری ارائه شده، با اضافه کردن یک ماژول جدید برای محاسبه کردن رتبه تنوع از هر سند بازیابی شده، معماری جستجو مبتنی بر سیستم های یادگیری ماشین مبتنی بر مجموع های افزایشی را توسعه می دهیم. نتایج به دست آمده از ارزیابی زمان تنوع نتایج بازیابی شده در معماری پیشنهادی نسبت به حالتی که کار تنوع نتایج بعد از بازیابی نتایج صورت می گیرد، نشان دهنده آنست که در معماری پیشنهادی سرعت تنوع نتایج بیشتر می باشد.