نام پژوهشگر: فاطمه پورغلامعلی
فاطمه پورغلامعلی محسن کاهانی
خلاصه سازی خودکار متون همزمان با رشد روز افزون اسناد و طلاعات بیش از پیش مورد توجه علاقه مندان حوزه پردازش زبان طبیعی قرار گرفته است. از این میان خلاصه سازی چند سنده که در آن چندین سند به عنوان ورودی دریافت می گردد، مورد توجه زیادی قرار گرفته است. در بسیاری از روش های تنها گزیده ای از جملات اولیه بدون تغییر به عنوان خلاصه برگردانده می شود. که به خلاصه سازی گزینشی معروف است. در مقابل آن در زمینه خلاصه سازی چکیده ای که برگرفته ای از جملات اولیه را خواهیم داشت، کار چندانی انجام نگرفته است. در این پایان نامه به بیان روشی برای خلاصه سازی چکیده ای و چند سنده خواهیم پرداخت که بر مبنای نقش های معنایی، شباهت معنایی جملات، فشرده سازی، حذف و ادغام آنها عمل می نماید. نتایج ارزیابی نشان دهنده بهبود روش های پیشنهادی شباهت معنایی کلمات و فشرده سازی جملات نسبت به روش های مرتبط پیشین می باشند. همچنین ارزیابی سیستم پیشنهادی برروی داده های کنفرانس duc و با استفاده از معیار ارزیابی rouge نشانگر بهبود نتایج نسبت به اکثریت مطلق سیستم های موجود در مجموعه داده مذکور می باشد.