تصحیح خودکار خطا در درخت بانک نحوی با استفاده از یادگیری ماشینی انتقال محور

نویسندگان

فرزانه زارعی

farzaneh zarei دانشگاه تهران هشام فیلی

hesham faili دانشگاه تهران مریم میریان

maryam mirian دانشگاه تهران

چکیده

درخت بانک یکی از پرکاربردترین منابع در به کارگیری روش های یادگیری باسرپرستی و نیمه سرپرستی در سامانه های پردازش زبان های طبیعی مانند ابزارهای شناسایی گفتار، تحلیلگرهای نحوی و نرم افزارهای مترجم ماشینی است. روش های مختلفی جهت تولید درخت بانک وجود دارد که می توان آن ها را به دو طبقه ی اصلی، روش های تولید دستی و روش های تولید خودکار تقسیم کرد. در هر یک از این روش ها، درخت بانک حاصل دارای خطاهایی هستند که البته میزان این خطاها در روش تولید خودکار به مراتب بیشتر است. وجود خطا در درخت بانک باعث می شود که نتوان از آن به عنوان یک منبع مناسب استفاده کرد. در این مقاله یک روش کاملا خودکار ارائه شده است که در آن سعی شده یک درخت بانک که با دستور درخت-پیوندی لغوی برچسب گذاری شده است، اصلاح گردد. روش ارائه شده نوعی روش تشخیص و تصحیح خطا براساس یادگیری انتقال محور است و بر روی یک درخت بانک که پیشتر به روش خودکار تولید شده بود اجرا شد و سبب بهبود آن بانک از 68% به 79% طبق معیار f1 شد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائۀ راهکاری قاعده‌مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت‌سازه‌ای برای زبان فارسی

In this paper, an automatic method in converting a dependency parse tree into an equivalent phrase structure one, is introduced for the Persian language. In first step, a rule-based algorithm was designed. Then, Persian specific dependency-to-phrase structure conversion rules merged to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences was used as an input ...

متن کامل

ارزیابی‌اطمینان‌پذیری تصفیه‌خانه فاضلاب شهری با استفاده از آنالیز درخت خطا

با توجه به رشد سریع جمعیت و نیاز فزاینده برای آب پاک و قابل اطمینان، تصفیه‌خانه‌های فاضلاب نقش مهمی در تامین یک منبع قابل اطمینان آب ایفا می‌نمایند. در این ارتباط اطمینان‌پذیری یک تصفیه‌خانه فاضلاب، زمانی که پساب خروجی، مجدداً استفاده شده و یا به منابع آبی تخلیه می‌شود، مسئله‌ای حیاتی است. عوامل اصلی مؤثر بر عملکرد تصفیه‌خانه‌های فاضلاب، تغییرات در ورودی، تغییرات ذاتی در فرآیندهای تصفیه و مشکلات...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار

Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. A...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پردازش علائم و داده ها

جلد ۱۲، شماره ۳، صفحات ۹۹-۱۰۸

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023