یک روش نوین بازیابی اطلاعات با تلفیق مدلهای فازی و فضای برداری

پایان نامه
چکیده

گرانبار شدن اطلاعات همراه با بازیابی اطلاعات یک مشکل عمده در وب کنونی به شمار می رود. برای مقابله با این مشکل، روشهای بسیاری برای بازیابی اطلاعات ارائه شده اند که بازیابی اسناد را با کاربران براساس علایق و نحوه پرسش آن ها سازگار می کنند. یک مولفه ی اساسی در هر سیستم بازیابی اطلاعات، کلمات کلیدی آن است. محتوای صفحات یک سند را می توان به منظور ایجاد مدل دقیق تری از کاربر مورد استفاده قرار داد، اما رویکردهای مبتنی بر کلمات کلیدی نگرش عمیقی از اسناد ندارند. اخیرا تحقیقاتی برای ترکیب کردن معنای موجود در وب سایت در نمایش کاربران آن انجام شده است. تمامی این تلاش ها یا از یک رده بندی یا واژگان شناختی خاص و دست ساخته و یا از واژگان شناختی های عمومی مانند wordnet برای نگاشت کلمات کلیدی مرتبط به پرسشها استفاده می کنند. با این وجود ساختن یک سلسله مراتب از مفاهیم بصورت دستی زمان بر و هزینه بر است. از سوی دیگر منابع معنایی لغوی عمومی از پوشش کم عبارات خاص دامنه رنج می برند. در این پایان نامه ما قصد داریم که هر دوی این نقص ها را برطرف کنیم. دستاورد اصلی ما این است که مکانیسمی برای بهبود بازیابی اطلاعات با ترکیب مدل فضای برداری(vector space model) و مدل فازی(fuzzy model) معرفی می کنیم. معماری ارائه شده شامل تعدادی مولفه است که عبارتند از: پیش پردازش اولیه، استخراج استخراج کلمات کلیدی از اسناد و پرسشها، سازنده ی بردار اسناد و پرسشها و نگاشت کلمات کلیدی مرتبط با پرسشها. دستاورد مهم دیگر استفاده از ساختار وب سایت برای محدود کردن خودکار مفاهیم خاص دامنه می باشد. سرانجام، آخرین دستاورد آن یک روش جدید نگاشت کلمات کلیدی به پرسشها است. ارزیابی های ما نشان می دهد که روش پیشنهادی همراه با منبع معنایی لغوی جامع آن کاربران را بصورت موثرتری نسبت به روش کلمات کلیدی وروش فضای برداری و فازی و نیز روش های بر مبنای wordnet نمایندگی می کند.

منابع مشابه

بررسی مدل فضای برداری در بازیابی اطّلاعات

بازیابی اطّلاعات، فرایند یافتن اطّلاعات (مدارک) مربوط به جستجوی کاربر در مجموعة مدارک است. با پیاده سازی الگوریتمهای متفاوت، استراتژیهای مختلفی در بازیابی اطّلاعات وجود دارد. وجه مشترک استراتژیهای بازیابی، یافتن مدارک مشابه با موضوع جستجوی کاربر است. یکی از الگوریتمهای مهمی که در بازیابی اطّلاعات، کاربرد بسیار دارد، الگوریتم فضای برداری است که می کوشد تمام مدارک را در مجموعه و جستجوهای کارب...

متن کامل

ضرورت‌های نوین بازنـگری در ذخیره و بازیابی اطلاعات

فرایند سازماندهی اطلاعات، در طول تاریخ از اهمیت ویژه‌ای برخوردار بوده و در هر زمان، بسته به نوع و ماهیت منابع اطلاعاتی و پارادایم‌ها و رویکردهای مسلط، رهیافت‌های متفاوتی برای سازماندهی اطلاعات مورد توجه قرار گرفته است. ولی امروزه همگام با توسعة جهان دانش، نیاز به بازنگری درنظام‌های سازماندهی این جهان، جدی‌ترشده. در این مقاله ابتدا ویژگی‌های نظام‌های طبقه‌بندی سنتی و سرعنوان‌های موضوعی ب...

متن کامل

تلفیق نتایج چند طبقه‏بندی‏کننده فازی با استفاده از قوانین اتصال در فضای توپولوژی فازی

طبقه‏بندی، تکنیکی در تحلیل تصاویر سنجش از دور است که به طور وسیع در کاربرد‏های مختلف استفاده می‏شود. در روش‏های طبقه‏بندی نظارت‏شده سنتی، اطلاعات آموزشی و نتایج طبقه‏بندی مبتنی بر اصل «هر پیکسل-یک کلاس» نمایش داده می‏شوند. در مواردی که عدم اطمینان و پیکسل‏های مختلط در سنجش از دور وجود دارد، استفاده از روش‏های فازی توصیه می‏شود. مطالعات اخیر نشان می‏دهند که استفاده از اطلاعات مجاورت به همراه اطل...

متن کامل

ارائه یک روش بازخورد ربط با رویکرد اصلاح معیار شباهت در یک سیستم بازیابی تصویر مبتنی بر جایگزینی فازی تصاویر اشعه x پزشکی با گراف نسبی ویژگی‌دار فازی

جهت بهبود عملکرد سیستم‌‌های بازیابی تصویر براساس محتوا از روش‌های بازخورد ربط1 استفاده می‌شود. در این مقاله، یک روش جدید بازخورد ربط با رویکرد اصلاح معیار شباهت در یک سیستم بازیابی تصویر مبتنی بر جایگزینی فازی تصاویر اشعه x پزشکی با گراف نسبی ویژگی‌دار فازی2 ارائه شده است. روش بازخورد ربط پیشنهادی با استفاده از میزان شباهت تصاویر مرتبط و غیرمرتبط با تصویر پرس‌وجو، وزن بهین...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و الکترونیک

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023