نام پژوهشگر: سید کاظم میردهقان
سید کاظم میردهقان علی محمد زارع بیدکی
جستجو در اینترنت کنونی به امری پیچیده تبدیل شده است. دلیل این امر رشد روزافزون در تصاویر موجود در وب می باشد. برای جستجوی تصاویر دلخواه کاربر، به یک موتور جستجوی کارامد نیاز است تا در کمترین زمان ممکن، متناسب ترین تصاویر با پرس وجوی کاربر را به او ارائه نماید. چالش اصلی موتورهای جستجو، رتبه بندی تصاویر بازیابی شده از پرس وجوی کاربر است. برای رتبه بندی تصاویر الگوریتم های مختلفی وجود دارد که می توان آن ها را به پنج دسته الگوریتم های مبتنی بر محتوای متنی ، الگوریتم های مبتنی بر محتوای دیداری ، الگوریتم های مبتنی بر اتصال ، الگوریتم های مبتنی بر رفتار کاربر و الگوریتم های ترکیبی تقسیم نمود. برخی از این الگوریتم ها از دقت کافی برخوردار نیستند و برخی دیگر دچار درجه پیچیدگی بالا در پردازش تصویر می باشند. هدف اصلی این پژوهش، مروری بر الگوریتم های رتبه بندی تصاویر بازیابی شده از پرس وجوی متنی کاربر و بررسی روش عملکرد و نقاط ضعف و قوت هر کدام می باشد. در ادامه روش جدیدی برای رتبه بندی تصاویر برای استفاده در موتورهای جستجو پیشنهاد می گردد که ترکیبی از رتبه بندی بر اساس محتوای متنی و به کارگیری محتوای دیداری تصاویر به منظور ادغام اسناد با تصاویر مشابه می باشد. این ادغام باعث غنی تر شدن محتوای متنی اسناد تصویری شده و دقت جستجو را افزایش می دهد. سپس با استفاده از یک الگوریتم یادگیری جفتی و مجموعه داده محک تولیدی که توسط افراد خبره برچسب گذاری شده است، وزن فیلدهای متنی مورد جستجو را تنظیم می کنیم. نتایج آزمایش ها نشان می دهد این روش می تواند دقت رتبه بندی را تا حد بالایی افزایش دهد.