ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون

Authors

Abstract:

Considering the vast amount of existing written information and the shortage of time, optimal summarization of books, articles, news reports, etc. on the Web is a major concern of researchers. In this paper, we propose a new approach for Persian single-document Summarization based on several linguistic features of text. In our approach after extracting the linguistic features for each sentence, the weight of features is learned by a linear regression method. We select one sentence with maximum score at each step of algorithm. The score of each sentence is calculated based on two factors: first, sum of the weighted features and second, the amount of its similarity to the sentences that are selected for final summary previously. We use an automatic evaluation tool to compare our approach with other existing approaches. The result indicates that our method improves the performance of summarization.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون

Nowadays summarizers and machine translators have attracted much attention to themselves, and many activities on making such tools have been done around the world. For Farsi like the other languages there have been efforts in this field. So evaluating such tools has a great importance. Human evaluations of machine summarization are extensive but expensive. Human evaluations can take months to f...

full text

ارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون

امروزه با افزایش منابع متنی در شبکه جهانی وب، هر روز بر گستره‏ ی اطلاعات قابل دسترس برای کاربران افزوده می شود بنابراین جهت نگهداری و بازیابی و پردازش آنها از سامانه ‏های خلاصه‏ سازی خودکار متن، استفاده می‏ کنیم. میزان کیفیت خلاصه‏ سازهای ماشینی، توسط انسان‏ها مورد بررسی قرار می‏ گیرد اما این کار نیروی متخصص و زمان زیادی را می‏ طلبد و هزینه بر خواهد بود. بنابراین برای حل این مشکل، در این مقاله ...

full text

سیستم خودکار خلاصه ساز متون فارسی

دراین پژوهش روشی ترکیبی از الگوریتم ژنتیک و شبکه عصبی rbf برای خلاصه سازی استخراجیِ متون فارسی پیشنهاد شده است، که ابتدا به امتیازدهی پاراگراف ها پرداخته می شود، سپس پاراگراف های برتر را انتخاب کرده و به محاسبه امتیاز جملات آن ها می پردازد. همچنین جهت تعیین میزان اهمیت هر یک از ویژگی های جملات از یک شبکه عصبی mlp بهره گرفته شده است. سپس با استفاده از یک شبکه عصبی rbf به گزینش جملات برتر به عنوان...

عملگرهای ناقص ساز در زبان فارسی: رویکردی شناختی

جستار حاضر به واکاوی افعال ایستا و عملگرهای ناقصساز در زبان فارسی از منظری شناختی میپردازد. در این راستا نمودهای واژگانی بر حسب معیارهای تقید زمانی و (نا)همگونی ساختاری مورد ارزیابی قرار میگیرند. در نتیجه محمولهای ناقص به صورت افعالی تبیین میشوند که تقید زمانی نداشته و فاقد ناهمگونی ساختاری میباشند؛ اما افعال کامل به صورت افعالی مقید و ناهمگون توصیف میگردند. در ادامه سه عملگر مهم و پربسامد استم...

full text

بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت

A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...

full text

ارائه یک روش خلاصه ساز خودکار متون فارسی به روش معنایی

خلاصه سازی خودکار متن یکی از جنبه های مهم در بازیابی اطلاعات می باشد. در این پایان نامه یک روش جدید برای خلاصهسازی خودکار متون فارسی پیشنهاد شده است که رویکردی مبتنی بر معنا دارد. روش پیشنهادی، دارای سه فاز پیش پردازش، پردازش و تولید خلاصه نهایی می باشد. در مرحله پیش پردازش، ریشه کلمات با استفاده از یک روش مبتنی بر فرهنگ واژگان بدست می آید. مجموعه ترادف جملات موجود در متن از طریق همین فرهنگ واژ...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 33  issue 4

pages  1845- 1864

publication date 2018-09

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023