ارائۀ راهکاری قاعده‌مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت‌سازه‌ای برای زبان فارسی

نویسندگان

چکیده مقاله:

In this paper, an automatic method in converting a dependency parse tree into an equivalent phrase structure one, is introduced for the Persian language. In first step, a rule-based algorithm was designed. Then, Persian specific dependency-to-phrase structure conversion rules merged to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences was used as an input for the algorithm and an equivalent phrase structure treebank was extracted. Finally, the statistical Stanford parser was trained using the developed treebank. Experimental results show a F1 of 96.05% for the conversion algorithm and an F1 of 86.01% for Persian factored model parser.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائۀ راهکاری قاعده مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت سازه ای برای زبان فارسی

هدف مقاله حاضر ارائۀ روشی خودکار جهت تبدیل درخت تجزیه نحوی وابستگی به درخت تجزیه نحوی مبتنی بر دستور ساخت سازه ای معادل در زبان فارسی است. برای نیل بدین هدف، الگوریتمی قاعده مند جهت این نوع تبدیل طراحی شده است. به منظور دستیابی به درخت تجزیۀ نحوی ساخت سازه ای مناسب برای جملات زبان فارسی، دستور زبان فارسی مورد مطالعه قرار گرفته و قوانین خاص زبان فارسی استخراج و به الگوریتم مذکور افزوده شده است. ...

متن کامل

تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار

Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. A...

متن کامل

میزان وابستگی نحوی و معنایی بندهای متممی در زبان فارسی

وابستگی از مهم‌ترین روابط بین عناصر نحوی است. در وابسته‌سازی، واحدی به واحد دیگری وابسته می‌شود. یکی از انواع ساخت‌های وابسته، بند متممی است. در این پژوهش به بررسی میزان وابستگی نحوی و معنایی بندهای متممی زبان فارسی می‌پردازیم. افعال متممی فارسی را براساس عوامل معنایی ازجمله احتمال انجام فعل بند اصلی، هم‌ارجاعی و هم‌زمانی بین بند متممی و بند اصلی، در طبقات متفاوت وابستگی قرار داده‌ایم. سپس، با ...

متن کامل

تصحیح خودکار خطا در درخت بانک نحوی با استفاده از یادگیری ماشینی انتقال محور

The Treebank is one of the most useful resources for supervised or semi-supervised learning in many NLP tasks such as speech recognition, spoken language systems, parsing and machine translation. Treebank can be developded in different ways that could be, generally, categorized in manually and statistical approaches. While the resulted Treebank in each of these methods has the annotation error,...

متن کامل

تولید درخت بانک سازه ای زبان فارسی به روش تبدیل خودکار

درخت بانک از مهم­ترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانک­ ها، درخت بانک وابستگی و درخت بانک سازه­ ای است. با توجه به نبود درخت بانک سازه ­ای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازه ­ای می­ پردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیف...

متن کامل

ساختار نحوی محمولِ ثانویه در زبان فارسی

برخی از جملات، علاوه بر محمولِ اصلی، حاوی نوعی محمولِ دیگر معروف به محمولِ ثانویه هستند. محمولِ ثانویه وضعیت فاعل یا مفعول را در هنگامِ وقوعِ عملِ فعل یا پس از آن توصیف می‌کند. در این پژوهش تلاش شده است تا با استفاده از شیوة توصیفی-تحلیلی و ازمنظرِ رویکرد کمینه‌گرا برخی مفاهیمِ مرتبط با محمولِ ثانویه در زبان فارسی، ازجمله مقولة نحوی محمول‌های ثانویه و همچنین نحوة اطلاق حالت به گروه تعریف مورد توصیف این م...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 12  شماره 4

صفحات  95- 115

تاریخ انتشار 2016-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023