تطبیق زمینه در ترجمه ماشینی
پایان نامه
- دانشگاه تربیت معلم - تهران - دانشکده مهندسی
- نویسنده حمید دلشادی
- استاد راهنما منوچهر کلارستاقی میر محسن پدرام
- سال انتشار 1394
چکیده
ترجمه ماشینی یکی از اولین اهداف هوش مصنوعی است که به دلیل نیاز روز افزون به فهم و استفاده از منابع زبان¬های دیگر اهمیت بسیاری دارد. روش¬های مختلفی مانند روش¬های مبتنی بر دستور زبان، مبتنی بر مثال و روش¬های آماری برای ترجمه ماشینی استفاده شده است. در اینجا از روش آماری عبارت بنیان که در سال¬های اخیر بسیار مورد توجه بوده است استفاده شده است. هدف نهایی در ترجمه ماشینی رسیدن به یک سیستم ترجمه ماشینی خودکار با کیفیت است. هم¬اکنون سیستم¬های ترجمه¬ای که خودکار عمل کنند وجود دارند، اما ترجمه سیستم تنها در مواردی خاص کیفیت مناسب را دارد. یکی از این موارد زمانی است که داده¬های آموزشی محدود به زمینه¬ای ¬باشند که ترجمه ماشینی در آن استفاده می شود. به منطبق کردن یک سیستم ترجمه ماشینی با یک زمینه خاص، تطبیق زمینه می¬گویند. داده¬های آموزشی برای زمینه¬های خاص بسیار کمیاب هستند و کیفیت ترجمه ماشینی با اندازه داده¬های آموزشی نیز ارتباط مستقیمی دارد. مشکل کمبود داده در زبان فارسی نیز به شدت وجود دارد. در این پژوهش تلاش می شود این مشکل حل شود. روش پیشنهادی این پژوهش بر پایه¬ی کاهش خطاهای سیستم شکل گرفته است. در این پژوهش خطای عدم مشاهده و خطای امتیاز هدف قرار گرفته شده است. برای حل مشکل عدم مشاهده، جدول ترجمه¬ای که با استفاده از داده¬های هم¬زمینه به دست آمده است را با استفاده از جدول ترجمه¬ای که از داده¬های عمومی به دست آمده غنی می کنیم. این رویکرد پر کردن نام دارد. برای مقابله با خطای امتیاز نیز ابتدا جمله¬هایی از داده¬های عمومی را که به داده¬های هم-زمینه شبیه هستند را با استفاده از مدل زبانی انتخاب می کنیم. سپس با افزودن این جمله¬ها به پیکره هم¬زمینه، آن را غنی¬تر می کنیم. در این انتخاب تلاش می شود که با حذف اسامی خاص بی اهمیت در زمینه، دقت انتخاب جمله¬ها افزایش یابد.
منابع مشابه
نگرشی بر ترجمه ماشینی
از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...
متن کاملگروه اعداد در ترجمه ماشینی
هدف از عرضه گروه اعداد، ساختن ترکیبات مجاز از اعداد اصلی و ترتیبی در زبان فارسی است. در این مقاله سی و هشت عضو دستگاه عددگویی فارسی در چهارگروه چندعضوی و دو گروه تک عضوی قرار داده شده اند. سی و هشت عضو مذکور در دو دسته قاعده کلی (یعنی قواعد گروه اعداد اصلی و اعداد ترتیبی) جای داده شده اند. تعداد قواعد اعداد اصلی شامل چهل و هفت، و تعداد قواعد اعداد ترتیبی (که خود بر دو نوع اند) شامل چهار قاعده ا...
متن کاملترجمه زبانشناختی و تطبیق فرهنگی
ترجمه زبانشناختی اشاره به نظریه ای است که براساس آن عناصر زبانشناختی متن اصلی بدون تغییر اساسی و توضیح اضافی در زبان مقصد معادل یابی می شوند. این روش ترجمه معمولا برای ترجمه متونی به کار میرود که علاوه بر معنی سبک نیز در آنها از اهمیت خاصی برخوردار است و در رساندن معنی دقیق نقش مهمی ایفا می کند. برخی این ترجمه را نوعی ترجمه صورت گرا میدانند که گاهی ، به ویژه در جملات پیچیده، ممکن است باعث ابهام...
متن کاملاستخراج پیکره موازی از اسناد قابلمقایسه برای بهبود کیفیت ترجمه در سیستمهای ترجمه ماشینی
Data used for training statistical machine translation method are usually prepared from three resources: parallel, non-parallel and comparable text corpora. Parallel corpora are an ideal resource for translation but due to lack of these kinds of texts, non-parallel and comparable corpora are used either for parallel text extraction. Most of existing methods for exploiting comparable corpora loo...
متن کاملمقایسه و بررسی برخی نظامهای ترجمه ماشینی روسی و غربی
نظامهای ترجمة ماشینی برتر دنیا قادرند کتابی هزار صفحهای را در کمتر از 2 دقیقه ترجمه کنند، کاری که مترجم زبده و حرفهای حداقل یک سال وقت روی آن صرف میکند. منتقدان، به کیفیت ترجمة این نظامها ایراداتی دارند، با این حال روند ترجمة ماشینی به سرعت رو به رشد است و باید به یاد داشت، ترجمه در نوع سنتی (انسانی) نیز رشد خود را در طی قرنها به دست آورده است و اکنون نیز اینگونه ترجمهها بدون نقص نیستند...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
دانشگاه تربیت معلم - تهران - دانشکده مهندسی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023