نام پژوهشگر: سیما درویشی
سیما درویشی منوچهر نحوی
با رشد روزافزون علم و منابع گسترده اطلاعاتی، استفاده از ابزارهای جستجو در وب، بیش از پیش مورد توجه قرار گرفته است. موتورهای جستجوی مختلف به کاربران این امکان را می دهند که با ورود کلمات کلیدی پاسخ پرسش خود را بیابند. موتور جستجو این کلمات را که قبلاً در بانک های اطلاعاتی خود ذخیره کرده جستجو می کند. انجام جستجوها در موتور جستجوی فارسی با توجه به قوانین نحوی، تلفظی و املایی آن، کار راحتی نیست و اگر به زبان ماشین نزدیکتر باشد، پاسخ مناسب تری مرتبط با موضوع پرسش یافت می شود. در وب معنایی از آنتولوژی برای مفاهیم یک دامنه به طوریکه برای ماشین قابل فهم باشد استفاده می شود. بنابراین، در این پایان نامه مدلی جهت غنی کردن پایگاه دانش موتور جستجوی فارسی از طریق توسعه آنتولوژی ارائه می شود، به این ترتیب که روابط بین واژگان در عبارات اسمی زبان فارسی برای یک ماشین قابل فهم شده و در هنگام پرسش کاربران، بتواند نزدیک ترین پاسخ را به آنان برگرداند. این مدل از طریق الگوهای نحوی، روابط جدیدی بین کلمات در عبارات اسمی زبان فارسی استخراج می کند که باعث بهبود آنتولوژی می شود به طوریکه در نتیج? جستجوی کاربران، معادل واژه ها و روابط بینشان نیز از طرف ماشین قابل تشخیص باشد. به جهت این غنی سازی از یک مجموعه متنی استاندارد فارسی به نام پیکره بی جن خان استفاده می شود. آزمایشات از طریق الگوهای زبانی و نحوی فارسی بدست آمده بر روی برخی متون این پیکره نشان داد که دقت مدل پیشنهادی حدود 87% است.