نام پژوهشگر: آصف پورمعصومی حسن کیاده
آصف پورمعصومی حسن کیاده محسن کاهانی
با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متون نیز با استقبال چشم گیر محققین روبرو شده است. در سال های اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، خلاصه سازی است که چندین سند را به عنوان ورودی دریافت کرده و گزبده ای از جملات اسناد اولیه را تولید می نماید. . خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد. در این پایان نامه با تمرکز به مشکلات اصلی خلاصه سازی چندسندی، یعنی پوشش کامل مطالب اصلی و عدم وجود افزونگی، روشی جدید برای خلاصه سازی ارائه شده است. در مدل پیشنهادی در ابتدا با دید کلی بر اسناد، زمینه آنها استخراج می شود. سپس جملات بر اساس شباهت با زمینه مرتب می شوند. در ادامه با استفاده از برچسب زنی معنایی جملات و شبکه واژگان، شباهت کلمات در نقش های معنایی یکسان محاسبه شده و افزونگی حذف می شود. برای استخراج زمینه از روش آنالیز روابط معنایی پنهان استفاده شده است. نحوه استفاده از این روش در این پایان نامه، باعث افزایش قابل توجه دقت نسبت به کاربردهای قبلی این تکنیک در روش های پیشین شده است. همچنین روش پیشنهادی برای حذف جملات تکراری نسبت به روش های گذشته، منجر به حذف با دقت بیشتر شده است. ارزیابی سیستم پیشنهادی برروی داده های کنفرانس duc و با استفاده از معیار ارزیابی rouge صورت گرفته است. همچنین سیستم پیشنهادی برروی پیکره کوچکی از متون فارسی هم ارزیابی شده است.