نام پژوهشگر: محمد رضا رجبی دهنوی
محمد رضا رجبی دهنوی فاخته سلطانی
در پردازش زبان های طبیعی و بازیابی اطلاعات متنی، یافتن متون مشابه از اهمیت بالایی برخوردار بوده و دارای کاربردهای فراوانی است. یافتن متون مشابه جزء دسته¬ی سیستم¬های پیچیده می¬باشد و معادل دستی ندارد. هدف از انجام این طرح، ارائه روشی جدید است که بتواند سوالات مشابه با سوال کاربران در مسائل شرعی و بخش احکام نماز را تشخیص دهد و پاسخ صحیح را به کاربر پیشنهاد دهد. رهیافت¬های متفاوتی برای یافتن متون مشابه وجود دارد که در این طرح از روش نزدیک¬ترین همسایگی استفاده شده است. ویژگی در نظر گرفته شده برای این سیستم n-gram می¬باشد و از معیار مشابهت dice جهت اندازه¬گیری شباهت متون استفاده گردیده است. برای ساخت این سیستم نیاز به یک پیکره عظیم از متون است؛ اما با توجه به اینکه این پیکره برای احکام نماز هنوز تهیه نشده است، از یک خزنده وب جهت جمع¬آوری سوالات استفاده گردید. با توجه به اینکه مجموعه سوالات موجود برای آموزش سیستم مورد نظر کافی نبود، پیشنهاد جدید استفاده از یک فرهنگ طیفی (گنج¬واژه - تزاروس) جهت توسعه بردار ویژگی¬ها می¬باشد. جهت ارزیابی نتایج از معیارهای دقت، بازخوانی و معیار f استفاده شده است. نتایج آزمایشات قبل از استفاده از تزاروس و همچنین ریشه¬یابی در بهترین حالت برابر 61% و با استفاده از تزاروس و عملیات ریشه¬یابی برابر 74% می¬باشد که نشان از بهبود دقت دارد.