ساخت پیکره ی دوزبانه موازی انگلیسی- فارسی و کاربرد آن در سامانه حافظه ترجمه (مبحثی در زبانشناسی پیکره ای)

پایان نامه
چکیده

در حال حاضر برونداد سامانه های ترجمه ماشینی نیاز به پس ویرایش دارد. در ترجمه ماشینی خودکار امکان دخالت کاربر حین کار وجود ندارد و مترجم پس از بروز خطا به رفع آن می پردازد. ابزارهای ترجمه می توانند با ایجاد محیطی تعاملی رفع خطاها را قبل از انتقال به برونداد ممکن سازند. مهمترینِ این ابزارها, سامانه های حافظه ترجمه هستند که از متون موازی همترازشده استفاده می کنند. فنون همترازسازی خودکار مورد استفاده در حافظه های ترجمه بیشتر در دو حالت کارآیی قابل توجه دارند: یکی در سطح پاراگراف و جمله و دیگری در سطح واژگان منفرد در صورت وجود رابطه یک به یک بین زیرتوالی های دو زبان. این امر باعث می شود که از تکرارهای زیر سطح جمله مانند جمله واره ها, عبارات و اصطلاحات استفاده حداکثری نشود. در این پژوهش, پس از زمینه سازی لازم, با استفاده از فاصله بین کلمات, شیوه ای تحت عنوان «جستجوی کاهشی فاصله بنیاد» با هدف استفاده حداکثری از منابع پیکره ای ارائه گردیده و بر اساس این شیوه, هسته اصلی یعنی موتور جستجوی یک سامانه حافظه ترجمه, در قالب یک برنامه نرم افزاری معرفی شده است. این شیوه روی بخشی از پیکره ساخته شده طی این پژوهش مرکب از زیرنویس فیلمها, آزمایش گردیده است. ارزیابی های صورت گرفته با نمرات «فراخوانی» و «دقّت» نشان می دهند که این شیوه بدون استفاده از فنون خودکار همترازسازی, شانس همتایابی برای زیرتوالی های جملات را بطور چشمگیری افزایش می دهد و بنابراین قابلیّت استفاده در یک سامانه حافظه ترجمه زیر سطح جمله را دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی

Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...

متن کامل

ساخت پیکره تطبیقی فارسی-انگلیسی و استخراج جملات موازی از آن

کیفیت بسیاری از کاربردهای پردازش زبان های طبیعی مانند سیستم های ترجمه ی ماشینی به پیکره های موازی که برای آموزش آنها استفاده می شود، بسیار وابسته است. بنابراین یکی از نیازهایی که در این حوزه وجود دارد، تهیه ی پیکره های موازی با حجم داده ای بالا و محتوای متنوع می باشد. مشکلی که در استفاده از پیکره های موازی وجود دارد، حجم اندک اطلاعات موازی موجود بر روی منابع اطلاعاتی است. در سال های اخیر، تلا...

15 صفحه اول

نقد کتاب کاربرد پیکره در تحلیل گفتمان

چکیده کاربرد پیکره در تحلیل گفتمان نوشتۀ پاول بیکر (2006) توسط انتشارات کانتینیوم (لندن و نیویورک) در 207 صفحه منتشر شده است. کتاب بر دو موضوع اصلی و ایجاد ارتباط بین آن‌ها متمرکز است: تحلیل گفتمان و زبان­شناسی پیکره­ای. تحلیل گفتمان که ماهیتی میان­رشته­ای دارد، در سال­های اخیر مورد توجه بسیاری از زبان­شناسان به‌ویژه پژوهشگران علاقه­مند به مباحث جامعه­شناسی زبان بوده است. پیکره زبانی مجموعه­ای...

متن کامل

ترجمه کتاب " پیکره مطالعاتی در زبانشناسی و ترجمه شناسی "

کتاب " پیکره مطالعاتی در زبانشناسی و ترجمه شناسی " ، اثری است جامع که توسط متخصصین رشته های مختلف در زمینه زبانشناسی و ترجمه شناسی به تحریر در آمده است. اثر حاضر به بررسی ارتباط بین زبانشناسی و ترجمه شناسی می پردازد. همچنین دراین کتاب تاثیر ذهنیت مترجم در کار ترجمه مورد کاوش قرار گرفته است. در بخش هایی از این اثر بررسی های عمیقی راجع به " پیکره مطالعاتی " و ارتباط آن با موضوع مورد مطالعه انجام ...

کاربرد پیکره های زبانی پویا در ترجمه اینترنتی متون فارسی به انگلیسی؛ بررسی عوامل مؤثر در بروز خطا

زبانشناسی پیکره شاخه­ای از زبانشناسی است که با گسترش فناوری­های نوین و شبکه جهانی اینترنت شاهد پیشرفت­های چشم­گیری بوده است. امروزه کاربرد شبکه جهانی تنها به جست ­و جوی مطالب و ارائه اطلاعات محدود نمی­شود. گسترش روزافزون فناوری­های نوین که در این شبکه ارائه می­شوند سبب پیدایش زمینه­های جدید در این عرصه شده است. ترجمه­ی برخط، تحت شبکه یکی از این زمینه­های نوین است که در حال حاضر دوران ابتدایی تک...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم انسانی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023