بررسی مقایسه‌ای تأثیر برچسب‌زنی مقولات دستوری بر تجزیه در پردازش خودکار زبان فارسی

author

  • قیومی, مسعود پژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایران
Abstract:

In this paper, the role of Part-of-Speech (POS) tagging for parsing in automatic processing of the Persian language is studied. To this end, the impact of the quality of POS tagging as well as the impact of the quantity of information available in the POS tags on parsing are studied. To reach the goals, three parsing scenarios are proposed and compared. In the first scenario, the parser assigns the POS tags firstly and then it parses the input sentence. In the second scenario, an external POS tagger is usedto assign the tags, then the sentence is parsed. In the third scenario, the parser uses the gold standard POS tags to parse the input sentence. In this study, various evaluation metrics are used to show the impacts from different points of views. The experimental results show that the quality of the POS tagger and the quantity of the information available in the POS tags have a direct effect on the parsing performance. The high quality of the POS tags causes error reduction in parsing and also it increases parsing performance. Moreover, lack ofmorphological -syntactic information in the POS tags has a high negative impact on parsing performance. This impact is more pronounced than the impact of POS tagger performance. 

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ضرورت توجه به مقولات لغوی و دستوری متفاوت در زبان روسی و فارسی و چگونگی تطبیق آن ها

می توان با اطمینان گفت، که مشکل ترین مقولة لغوی و دستوری در زبان روسی، مقولة افعال این زبان است. فعل در هر زبانی هستهء مرکزی صرف را تشکیل می دهد و در زبان روسی به لحاظ وجود برخی مکانیسم های دیگر که از مهم ترین آن ها نگرش گوینده به نحوهء چگونگی آن است، با زبان فارسی تفاوت دارد. همچنین مقوله مطلق و استمراری افعال در زبان روسی به لحاظ ایجاد تغییرات معنایی از ظرافت خاصی برخودار است. به همین علت مجر...

full text

تأثیر ساخت‌واژه‌ها در تجزیه وابستگی زبان فارسی

Data-driven systems can be adapted to different languages and domains easily. Using this trend in dependency parsing was lead to introduce data-driven approaches. Existence of appreciate corpora that contain sentences and theirs associated dependency trees are the only pre-requirement in data-driven approaches. Despite obtaining high accurate results for dependency parsing task in English langu...

full text

بررسی مفاهیم وجهی زمان دستوری در زبان فارسی

استفاده از زمان دستوری برای بیان مفاهیم وجهی، یا به عبارتی شیوه‌های استفاده از زمان دستوری به عنوان ابزار اعمال نظر گوینده در مورد محتوای گزاره در زبان فارسی، موضوعی است که در مقالة حاضر مورد بررسی قرار می‌گیرد. نتایج این بررسی نشان می‌دهد که ساختارهای زمانی در زبان فارسی چه در زمان گذشته و چه غیر‌گذشته در قالب‌های مختلفی از جمله شرطی، انعکاس اشاره ای و ساختار تمنایی و التزامی به طور فعال در ان...

full text

تأثیر راهبرد ترجمه بر خطاهای دستوری و واژگانیِ فارسی‌آموزان چینی در نگارش به زبان فارسی

از آن‏جا که مهم‌ترین و کاربردی‌ترین مرحله در فرایند بررسی و واکاوی خطاهای زبانی یادگیرندگان زبان دوم/خارجی، یافتن راهکارهایی برای کاهش این نوع خطاها می‌باشد، پژوهش حاضر به بررسی تأثیر به‌کارگیری «راهبرد ترجمه» بر کاهش میزان خطاهای دستوری و واژگانی فارسی‌آموزان چینی پرداخته است. به همین منظور، از 12 فارسی‌آموز چینی پیشرفته خواسته شد که در دو مرحله، به نگارش یک متن به زبان فارسی بپردازند. در مرحل...

full text

مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات

هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبه‎روست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات می‎گذارد. پژوهش حاضر می‎کوشد تا با بررسی متون و پیشینه‎های موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد‎های ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار د...

full text

بررسی تباین کلی اصطلاحات دستوری در زبان فارسی و آلمانی در آموزش زبان آلمانی

بی‌ گمان ، اصطلاحات دستوری به‌ تنهایی کمک چندانی در آموختن زبان بیگانه نمی‌ کنند، اما باید توجه داشت که چنانچه دستور زبانی ، به هر دلیل، به زبان فارسی نوشته ‌شود ، باید تفاوت‌ های میان اصطلاحات دستوری این دو زبان نیز در نظر گرفته شوند تا خوانندگان دچار لغزش نشوند . بیشتر نویسندگان دستور آلمانی در ایران ، آلمانی ‌دانهای ایرانی ‌اند که گاهی در برگردان اصطلاحات دستوری دچار خطا شده‌اند ، امری که می...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 13  issue 4

pages  121- 132

publication date 2017-03

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023