نام پژوهشگر: محمد باقر غزنوی

یادگیری هوشمند هستان نگار برای بسط پرسمان در جستجوی معنایی (مورد پژوهی:کتابخانه دیجیتالی)
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده فنی مهندسی 1390
  مریم حورعلی   غلامعلی منتظر

در سالهای اخیر تلاشهای زیادی برای طراحی روشهای یادگیری و خودکار سازی فرایند ساخت هستان نگار در جهان انجام شده است. هستان نگارها در زمینه های زیادی نظیر وب معنایی، جویشگرها، تجارت الکترونیکی، پردازش زبان طبیعی، مهندسی دانش، استخراج و بازیابی اطلاعات، طراحی دادگان، سامانه های چند کارگزاره و کتابخانه های دیجیتال و غیره کاربرد دارند. مشکل عمده در ساختن هستان نگارها، اکتساب دانش و زمانبر بودن ساخت آنها برای کاربردهای مختلف است. بنابراین ساخت خودکار هستان نگار راه حل مناسبی برای چیره شدن بر این مشکلات است. در دو دهه اخیر فعالیت های زیادی در زمینه یادگیری هستان نگار انجام شده و روش ها، ابزارها و سامانه های مختلفی نیز ارائه شده که از روشها و الگوریتم های رشته های مختلفی مانند پردازش زبان طبیعی، یادگیری ماشینی، اکتساب دانش، استخراج اطلاعات ، پردازش نمادین و احتمالاتی بهره می گیرند. سامانه های پیشنهاد شده در بسیاری از شاخصها، خصیصه ها و روشهای یادگیری از سایر سامانه های متمایز هستند. در این رساله روش نوینی برای یادگیری هوشمند هستان نگار در تمام سطوح یادگیری ارائه شده که می توان از آن در کاربردها و حوزه های مختلف استفاده کرد. در این روش نیازی به وجود هستان نگارهای عمومی یا تخصصی اولیه و واژگان معنایی از پیش تعریف شده نبوده و پایگاه دانش اولیه آن تنها شامل مجموعه ای از متون ورودی است. سامانه یادگیرنده پیشنهادی با شروع از متون ورودی و با استفاده از رهیافت پیشنهادی در این رساله قادر خواهد بود هستان نگار حوزه های مختلف را استخراج کند. در این روش از ترکیبی از روشهای زبانی، آماری، مبتنی بر الگو و روشهای یادگیری ماشین بر اساس روش c-value، شبکه عصبی نظریه تشدید وفقی و شبکه بیز استفاده شده است. از طرفی به منظور مواجهه با عدم قطعیت داده ها و غنی سازی هستان نگار قطعی، با استفاده از ترکیب شبکه عصبی و نظریه فازی روش نوینی برای استخراج هستان نگار فازی پیشنهاد شده است. از این روش در استخراج هستان نگارهای قطعی و فازی حوزه فنّاوری اطلاعات استفاده شده است. هستان نگارهای استخراج شده به منظور جستجوی معنایی اسناد کتابخانه محلی (که در آن اسناد مرتبط با حوزه فنّاوری اطلاعات قرار داده شده) بر اساس رویکرد بسط پرسمان به کار برده شده اند. نتایج حاصل از پیاده سازی هستان نگار فازی بیانگر دقت بالاتر حدود 0.07 و نتایج حاصل از پیاده سازی هستان نگار قطعی بیانگر دقت بالاتر حدود 0.05 نسبت به روشهای مبتنی بر کلید واژه است. همچنین میانگین دقت مفاهیم هستان نگار فازی حدود 0.09 و میانگین دقت مفاهیم هستان نگار قطعی حدود 0.06 نسبت به میانگین دقت مفاهیم سایر روشهای مشابه بهبود داشته است.