نام پژوهشگر: احسان خون سیاوش
احسان خون سیاوش احمد براآنی دستجردی
با رشد فزاینده و لجام گسیخته اطلاعات دیجیتالی و نیاز به دستیابی به اطلاعات مورد نظر از میان خیل انبوه متون و اسناد موجود در زمان معقول، نیاز به سیستم های بازیابی اطلاعاتی که بتوانند نیاز اطلاعاتی کاربران را کامل تر و دقیق تر تشخیص داده و متون و اسناد مرتبط با آن را بازیابی کند، بیش از پیش احساس می شود. به دلیل ویژگی های خاص زبان طبیعی نظیر چند معنایی عبارت، ارتباطات معنایی نهفته و ... ، تنها مقایسه عبارات موجود در پرس جوی کاربران با اسناد موجود به منظور جستجوی نیاز اطلاعاتی کاربران در نمایه سیستم، کافی نبوده و نتایج حاصل نمی تواند به طور مطلوب پاسخ گوی نیاز کاربران باشد. هدف از انجام این تحقیق شناسایی مفاهیم مستتر در دامنه معنایی متون و اسناد، به منظور استفاده در نمایه سازی و بهبود عملکرد سیستم های بازیابی اطلاعات می باشد. برای انجام این کار دامنه معنایی متن را با استفاده از دامنه معنایی مفاهیم که در پایگاه دانش سیستم تعریف شده، شناسایی می نماییم. سپس مفاهیم مستتر در دامنه معنایی متن را استخراج و بر اساس ارتباط معنایی که با متن(مفاهیم موجود در متن) دارند، رده بندی می کنیم. مفاهیم موجود در صدر رده بندی فوق به عنوان مهم ترین مفاهیم مستتر در دامنه معنایی متن به نمایه متن افزوده می شوند تا در زمان مقایسه پرس جوها با نمایه مدنظر قرار بگیرند. پیاده سازی ایده فوق به ابداع دو روش اکتشافی، یکی در زمینه مهندسی دانش و هستی شناسی و دیگری در زمینه پردازش زبان طبیعی انجامید. در زمینه هستی شناسی یک روش جدید برای نمایش مفاهیم توسط یک بردار معنایی در فضای n-بعدی دامنه ارائه شد. برای نگاشت متن به پایگاه دانش سیستم، مفهوم هسته های معنایی متن بر اساس زنجیره های معنایی ارائه شده و مورد استفاده قرار گرفت. برای ارزیابی ایده های موردنظر، سیستم فوق به صورت یک ماجول پیش پردازش گر به یک سیستم بازیابی اطلاعات فضای برداری وزن دار(vsm) افزوده شده و تغییرات عملکرد این سیستم در حالت عادی (بدون وجود ماجول پیش پردازش گر) و هنگامی که ورودی آن از سیستم مورد نظر ما تامین می شود، مقایسه شد. در پیاده سازی ماجول پیش پردازش گر معنایی از wordnet به عنوان پایگاه دانش سیستم استفاده شد. نتایج ارزیابی عملکرد سیستم بر روی 4 مجموعه از اسناد آزمایش سیستم های بازیابی اطلاعات، حاکی از عملکرد نوید بخش در صورت تعیین مقادیر مناسب برای پارامترهای ورودی و استفاده از پایگاه دانش مناسب می باشد.