تطبیق زمینه در ترجمه ماشینی

پایان نامه
چکیده

ترجمه ماشینی یکی از اولین اهداف هوش مصنوعی است که به دلیل نیاز روز افزون به فهم و استفاده از منابع زبان¬های دیگر اهمیت بسیاری دارد. روش¬های مختلفی مانند روش¬های مبتنی بر دستور زبان، مبتنی بر مثال و روش¬های آماری برای ترجمه ماشینی استفاده شده است. در اینجا از روش آماری عبارت بنیان که در سال¬های اخیر بسیار مورد توجه بوده است استفاده شده است. هدف نهایی در ترجمه ماشینی رسیدن به یک سیستم ترجمه ماشینی خودکار با کیفیت است. هم¬اکنون سیستم¬های ترجمه¬ای که خودکار عمل کنند وجود دارند، اما ترجمه سیستم تنها در مواردی خاص کیفیت مناسب را دارد. یکی از این موارد زمانی است که داده¬های آموزشی محدود به زمینه¬ای ¬باشند که ترجمه ماشینی در آن استفاده می شود. به منطبق کردن یک سیستم ترجمه ماشینی با یک زمینه خاص، تطبیق زمینه می¬گویند. داده¬های آموزشی برای زمینه¬های خاص بسیار کمیاب هستند و کیفیت ترجمه ماشینی با اندازه داده¬های آموزشی نیز ارتباط مستقیمی دارد. مشکل کمبود داده در زبان فارسی نیز به شدت وجود دارد. در این پژوهش تلاش می شود این مشکل حل شود. روش پیشنهادی این پژوهش بر پایه¬ی کاهش خطاهای سیستم شکل گرفته است. در این پژوهش خطای عدم مشاهده و خطای امتیاز هدف قرار گرفته شده است. برای حل مشکل عدم مشاهده، جدول ترجمه¬ای که با استفاده از داده¬های هم¬زمینه به دست آمده است را با استفاده از جدول ترجمه¬ای که از داده¬های عمومی به دست آمده غنی می کنیم. این رویکرد پر کردن نام دارد. برای مقابله با خطای امتیاز نیز ابتدا جمله¬هایی از داده¬های عمومی را که به داده¬های هم-زمینه شبیه هستند را با استفاده از مدل زبانی انتخاب می کنیم. سپس با افزودن این جمله¬ها به پیکره هم¬زمینه، آن را غنی¬تر می کنیم. در این انتخاب تلاش می شود که با حذف اسامی خاص بی اهمیت در زمینه، دقت انتخاب جمله¬ها افزایش یابد.

منابع مشابه

نگرشی بر ترجمه ماشینی

از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...

متن کامل

گروه اعداد در ترجمه ماشینی

هدف از عرضه گروه اعداد، ساختن ترکیبات مجاز از اعداد اصلی و ترتیبی در زبان فارسی است. در این مقاله سی و هشت عضو دستگاه عددگویی فارسی در چهارگروه چندعضوی و دو گروه تک عضوی قرار داده شده اند. سی و هشت عضو مذکور در دو دسته قاعده کلی (یعنی قواعد گروه اعداد اصلی و اعداد ترتیبی) جای داده شده اند. تعداد قواعد اعداد اصلی شامل چهل و هفت، و تعداد قواعد اعداد ترتیبی (که خود بر دو نوع اند) شامل چهار قاعده ا...

متن کامل

ترجمه زبانشناختی و تطبیق فرهنگی

ترجمه زبانشناختی اشاره به نظریه ای است که براساس آن عناصر زبانشناختی متن اصلی بدون تغییر اساسی و توضیح اضافی در زبان مقصد معادل یابی می شوند. این روش ترجمه معمولا برای ترجمه متونی به کار میرود که علاوه بر معنی سبک نیز در آنها از اهمیت خاصی برخوردار است و در رساندن معنی دقیق نقش مهمی ایفا می کند. برخی این ترجمه را نوعی ترجمه صورت گرا میدانند که گاهی ، به ویژه در جملات پیچیده، ممکن است باعث ابهام...

متن کامل

استخراج پیکره‌ موازی از اسناد قابل‌مقایسه برای بهبود کیفیت ترجمه در سیستم‌های ترجمه ماشینی

Data used for training statistical machine translation method are usually prepared from three resources: parallel, non-parallel and comparable text corpora. Parallel corpora are an ideal resource for translation but due to lack of these kinds of texts, non-parallel and comparable corpora are used either for parallel text extraction. Most of existing methods for exploiting comparable corpora loo...

متن کامل

مقایسه و بررسی برخی نظام‌های ترجمه ماشینی روسی و غربی

نظام‌های ترجمة ماشینی برتر دنیا قادرند کتابی هزار صفحه‌ای را در کمتر از 2 دقیقه ترجمه کنند، کاری که مترجم زبده و حرفه‌ای حداقل یک سال وقت روی آن صرف می‌کند. منتقدان، به کیفیت ترجمة این نظام‌ها ایراداتی دارند، با این حال روند ترجمة ماشینی به سرعت رو به رشد است و باید به یاد داشت، ترجمه در نوع سنتی (انسانی) نیز رشد خود را در طی قرن‌ها به دست آورده است و اکنون نیز این‌گونه ترجمه‌ها بدون نقص نیستند...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023