نام پژوهشگر: اعظم فیض نیا

رتبه بندی نتایج پرس و جوهای sparql بر مبنای تحلیل پیوند و محتوا
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  اعظم فیض نیا   محسن کاهانی

حجم بالا و رو به رشد داده¬های پیوندی منتشر شده در وب، بر اهمیت موتورهای جستجوی معنایی برای بازیابی اطلاعات مورد نیاز کاربران افزوده است. معمولا کاربران از بین نتایج بازگردانده شده، تنها چند نتیجه¬ی اول را مورد بررسی قرار می¬دهند. لذا ترتیب نمایش نتایج و انتخاب الگوریتم رتبه¬بندی مناسب، در میزان رضایت کاربر از موتور جستجو تاثیر زیادی دارد. ساخت¬یافتگی داده¬های وب معنایی این امکان را فراهم کرده است که کاربران بتوانند براساس پرس¬وجوهای ساخت یافته و دقیق sparql به جستجوی وب بپردازند. بنابراین برخلاف وب اسناد که در آن، جستجو تنها براساس پرس¬وجوی کلمه ی کلیدی ممکن بود، در موتورهای جستجوی وب معنایی امکان پاسخ به پرس¬وجوهای غیرمبهم sparql به وجود آمده است. روش¬های رتبه¬بندی که تاکنون برای نتایج پرس¬وجوهای sparql ارائه شده¬اند، تنها با استفاده از الگوریتم¬های تحلیل پیوند، رتبه¬ی محبوبیت نتایج را محاسبه می¬کنند. در این پایان¬نامه، یک روش جدید رتبه¬بندی برای نتایج پرس¬وجو های sparql ارائه شده است که میزان ارزشمند بودن هر پاسخ را براساس ترکیب رتبه¬های محبوبیت و مرتبط بودن اندازه¬گیری می¬کند. در روش پیشنهادی، رتبه¬ی محبوبیت از طریق تعمیم الگوریتم رتبه¬بندی pagerank روی گراف دو لایه از منابع¬داده¬ و اسناد معنایی و تخصیص خودکار وزن به پیوندهای معنایی مختلف، محاسبه می¬شود. رتبه¬¬ی مرتبط بودن، از طریق تحلیل محتوای اسناد معنایی و پرس¬وجوی sparql، اندازه¬گیری می¬شود. نتایج حاصل از ارزیابی نشان می دهد که مدل داده¬ی پیشنهادی متناسب با ویژگی گرافی پرس¬وجوهای sparql بوده و در محاسبه¬ی رتبه¬ی نتایج پرس¬وجوهای sparql موفق است و رتبه¬بندی براساس ترکیب رتبه¬های محبوبیت و مرتبط بودن، باعث بهبود دقت رتبه¬بندی می شود.