نام پژوهشگر: فراز محمدیان جدول قدم
فراز محمدیان جدول قدم احمد رضا نقش نیلچی
خلاصه سازی خودکار متن یکی از جنبه های مهم در بازیابی اطلاعات می باشد. در این پایان نامه یک روش جدید برای خلاصهسازی خودکار متون فارسی پیشنهاد شده است که رویکردی مبتنی بر معنا دارد. روش پیشنهادی، دارای سه فاز پیش پردازش، پردازش و تولید خلاصه نهایی می باشد. در مرحله پیش پردازش، ریشه کلمات با استفاده از یک روش مبتنی بر فرهنگ واژگان بدست می آید. مجموعه ترادف جملات موجود در متن از طریق همین فرهنگ واژگان بدست می آید. این کار منجر به یک زنجیره لغوی قوی می شود. در مرحله پردازش، با استفاده از زنجیره لغوی و روش تحلیل معنای پنهان، ارتباط بین جملات مهم بدست می آید تا جملات مرتبط با هم گزینش و در خروجی قرار گیرند. در مرحله تولید خلاصه، برای رفع افزونگی و تکرار، جملات مشابه در خروجی با جملات انتخاب شده مقایسه شده و در صورت داشتن شباهت نسبی (با انتخاب ضریب میزان تشابه 80?) از قرار دادن آن در خلاصه نهایی جلوگیری می شود. دو شیوه برای ارزیابی خلاصه ساز پیشنهادی ارائه شده است. یکی روش ارزیابی مستقیم و دیگری روش ارزیابی مبتنی بر lsa (تحلیل معنایی پنهان) است. نتایج ارزیابی نشان می دهد به دلیل استفاده از فرهنگ واژگان غنی، ریشه یابی با دقت بالائی انجام می گیرد که در مقایسه با روش های مشابه کارایی بالائی دارد. به دلیل استفاده از همین فرهنگ واژگان غنی، مجموعه ترادف و زنجیره لغوی ارتباط معنای کلمات و جملات در روش تحلیل معنایی پنهان بسط داده شده به درستی بدست آورده می شود که نتایج حاکی از این امر دارد. در نهایت نتایج ارزیابی نشان می دهد که روش ارائه شده خلاصه قابل قبول و منسجمی ارائه می دهد.