ارائه یک رتبه‌بند برای خطایاب معنایی با استفاده از ویژگی‌های حساس به متن

Authors

Abstract:

Nowadays, a large volume of documents is generated daily. These documents generated by different persons, thus, the documents contain spelling errors. These spelling errors cause quality of the documents are decrease. Therefore, existence of automatic writing assistance tools such as spell checker/corrector can help to improve their quality. Context-sensitive are misspelled words that have been wrongly converted into another word of the language. Thus, detection of real-word errors requires discourse analysis. In this paper, we propose a language independent discourse-aware discriminative ranker and use information of whole document and a log-linear model for ranking. To evaluate our method, we augment it into two context-sensitive spellchecker systems one is based on Statistical Machine Translation (SMT) and the other is based on language model. For more evaluation, we also use two different tests. Proposed method cause outperform about 17% over the SMT base approach with respect to detection and correction recall.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائه یک رتبه بند برای خطایاب معنایی با استفاده از ویژگی های حساس به متن

در عصر فناوری، روزانه حجم زیادی از سند­های الکترونیکی تولید می­شود. از آنجا که این سند­ها توسط افراد مختلف تولید می­شود دارای خطاهایی هستند. وجود خطاها باعث کاهش کیفیت سند­ها می­شود، بنابراین وجود ابزارهای خطایاب باعث افزایش کیفیت می­شود. یکی از انواع خطاها، خطای معنایی حساس به متن است. همانطور که از نام این آن برمی­آید، برای تشخیص و تصحیح آن، نیاز به تحلیل اطلاعات موجود در متن است. در این مقال...

full text

ارائه رویکردی برای مدیریت و سازمان‌دهی اسناد متنی با استفاده از تجزیه‌وتحلیل هوشمند متن

Regarding the fact that stored data occupies a large space in organizations and retention systems and information management that has been resulted in gigantic data warehouses, the need for extracting an appropriate model is felt increasingly. Text mining is one of the most significant methods for extracting a useful and appropriate model that helps organizations in achieving their goals throug...

full text

ارائه یک الگوریتم بهبود یافته وب کاوی برای وب معنایی

این مقاله در حوزه داده کاوی و وب معنایی بوده و در آن روشی برای شخصی سازی صفحات وب براساس اصول داده کاوی و وب معنایی ارائه شده است. روش پیشنهادی، از لاگ مشاهده صفحات توسط کاربران به عنوان خوراک بخش داده کاوی، و از محتوای صفحات به عنوان ورودی واحد پردازش معنا استفاده می کند. نتایج حاصل از این دو فرآیند، با یکدیگر ترکیب شده و به عنوان صفحات پیشنهادی مدنظر کاربر، به او ارائه می شود. ایده استفاده از...

full text

بازسازی معنایی رساله برای دانشجویان دوره دکتری با نگاهی آسیب‌شناسانه و ارائه یک نظریه زمینه‌ای

هدف پژوهش حاضر، بازسازی نهایی رساله برای دانشجویان دوره دکتری با نگاهی آسیب‌شناسانه و ارائه یک نظریه زمینه‌ای است. پژوهش از نوع کیفی و از روش مردم‌نگاری استفاده شده است. جامعه آماری تحقیق شامل دانشجویان دوره دکتری دانشکده روان‌شناسی و علوم تربیتی دانشگاه علامه طباطبایی می‌باشد و نمونه آماری با استفاده از روش نمونه‌گیری هدفمند، (تعداد 15 دانشجوی دوره دکتری که در مراحل مختلف تدوین رساله دکتری بود...

full text

استخراج ویژگیهای نوین برای طبقه بندی مدولاسیون با استفاده از یک دمدولاتور 8PSK

In this paper a feature-based modulation classification algorithm is developed for discriminating PSK signals. The candidate modulation types are assumed to be QPSK, OQPSK, π/4 DQOSK and 8PSK. The proposed method applies an 8PSK baseband demodulator in order to extract required features from observed symbols. The received signal with unknown modulation type is demodulated by an 8PSK demodulator...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 12  issue 3

pages  3- 14

publication date 2015-12

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023