نام پژوهشگر: سعیده غلامرضازاده مطلق
سعیده غلامرضازاده مطلق مهرداد جلالی
سیستم های خلاصه برداری از متن، یافتن اطلاعات مورد نیاز را از میان خیل عظیم اطلاعاتی که در قالب متن هستند، تسریع می کنند. این سیستم ها از روش های مختلفی برای انتخاب مهم ترین موضوعات متن استفاده می کنند. یکی از روش هایی که در این زمینه به صورت گسترده مورد استفاده قرار می گیرد، استفاده از ساختار گراف و ویژگی های آن برای انتخاب مهم ترین جملات متن است. الگوریتم ارائه شده در این تحقیق، سعی در خلاصه سازی متون فارسی با استفاده از ساختار گراف و ساختن مسیر بر اساس آن دارد. الگوریتم پیشنهادی، متن ورودی را به صورت گراف نمایش داده و با استفاده از ویژگی های ساختار گراف، روش های آماری، ویژگی های ساختاری متن و استفاده از مسیرها، مهم ترین و پر محتواترین جملات متن را انتخاب می کند. نوآوری این الگوریتم در مقایسه با کارهای پیشین، استفاده از مسیرها و بررسی میزان اهمیت ارتباط موجود بین جملات، به منظور حفظ هر چه بیشتر انسجام و جریان موضوعی متن است. برای ارزیابی کیفیت خلاصه تولیدی، میزان شباهت آن با خلاصه انسانی مورد بررسی قرار گرفته است. نتایج بررسی ها نشان می دهد که الگوریتم ارائه شده در مقایسه با کارهای پیشین مطرح شده در زمینه خلاصه سازی متون فارسی، خلاصه ای با شباهت بیشتر به خلاصه انسانی تولید می کند.