ساخت پیکره ی دوزبانه موازی انگلیسی- فارسی و کاربرد آن در سامانه حافظه ترجمه (مبحثی در زبانشناسی پیکره ای)
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم انسانی
- نویسنده حسین کشتکار
- استاد راهنما طیبه موسوی میانگاه مریم السادات غیاثیان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
در حال حاضر برونداد سامانه های ترجمه ماشینی نیاز به پس ویرایش دارد. در ترجمه ماشینی خودکار امکان دخالت کاربر حین کار وجود ندارد و مترجم پس از بروز خطا به رفع آن می پردازد. ابزارهای ترجمه می توانند با ایجاد محیطی تعاملی رفع خطاها را قبل از انتقال به برونداد ممکن سازند. مهمترینِ این ابزارها, سامانه های حافظه ترجمه هستند که از متون موازی همترازشده استفاده می کنند. فنون همترازسازی خودکار مورد استفاده در حافظه های ترجمه بیشتر در دو حالت کارآیی قابل توجه دارند: یکی در سطح پاراگراف و جمله و دیگری در سطح واژگان منفرد در صورت وجود رابطه یک به یک بین زیرتوالی های دو زبان. این امر باعث می شود که از تکرارهای زیر سطح جمله مانند جمله واره ها, عبارات و اصطلاحات استفاده حداکثری نشود. در این پژوهش, پس از زمینه سازی لازم, با استفاده از فاصله بین کلمات, شیوه ای تحت عنوان «جستجوی کاهشی فاصله بنیاد» با هدف استفاده حداکثری از منابع پیکره ای ارائه گردیده و بر اساس این شیوه, هسته اصلی یعنی موتور جستجوی یک سامانه حافظه ترجمه, در قالب یک برنامه نرم افزاری معرفی شده است. این شیوه روی بخشی از پیکره ساخته شده طی این پژوهش مرکب از زیرنویس فیلمها, آزمایش گردیده است. ارزیابی های صورت گرفته با نمرات «فراخوانی» و «دقّت» نشان می دهند که این شیوه بدون استفاده از فنون خودکار همترازسازی, شانس همتایابی برای زیرتوالی های جملات را بطور چشمگیری افزایش می دهد و بنابراین قابلیّت استفاده در یک سامانه حافظه ترجمه زیر سطح جمله را دارد.
منابع مشابه
پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی
Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...
متن کاملساخت پیکره تطبیقی فارسی-انگلیسی و استخراج جملات موازی از آن
کیفیت بسیاری از کاربردهای پردازش زبان های طبیعی مانند سیستم های ترجمه ی ماشینی به پیکره های موازی که برای آموزش آنها استفاده می شود، بسیار وابسته است. بنابراین یکی از نیازهایی که در این حوزه وجود دارد، تهیه ی پیکره های موازی با حجم داده ای بالا و محتوای متنوع می باشد. مشکلی که در استفاده از پیکره های موازی وجود دارد، حجم اندک اطلاعات موازی موجود بر روی منابع اطلاعاتی است. در سال های اخیر، تلا...
15 صفحه اولنقد کتاب کاربرد پیکره در تحلیل گفتمان
چکیده کاربرد پیکره در تحلیل گفتمان نوشتۀ پاول بیکر (2006) توسط انتشارات کانتینیوم (لندن و نیویورک) در 207 صفحه منتشر شده است. کتاب بر دو موضوع اصلی و ایجاد ارتباط بین آنها متمرکز است: تحلیل گفتمان و زبانشناسی پیکرهای. تحلیل گفتمان که ماهیتی میانرشتهای دارد، در سالهای اخیر مورد توجه بسیاری از زبانشناسان بهویژه پژوهشگران علاقهمند به مباحث جامعهشناسی زبان بوده است. پیکره زبانی مجموعهای...
متن کاملترجمه کتاب " پیکره مطالعاتی در زبانشناسی و ترجمه شناسی "
کتاب " پیکره مطالعاتی در زبانشناسی و ترجمه شناسی " ، اثری است جامع که توسط متخصصین رشته های مختلف در زمینه زبانشناسی و ترجمه شناسی به تحریر در آمده است. اثر حاضر به بررسی ارتباط بین زبانشناسی و ترجمه شناسی می پردازد. همچنین دراین کتاب تاثیر ذهنیت مترجم در کار ترجمه مورد کاوش قرار گرفته است. در بخش هایی از این اثر بررسی های عمیقی راجع به " پیکره مطالعاتی " و ارتباط آن با موضوع مورد مطالعه انجام ...
کاربرد پیکره های زبانی پویا در ترجمه اینترنتی متون فارسی به انگلیسی؛ بررسی عوامل مؤثر در بروز خطا
زبانشناسی پیکره شاخهای از زبانشناسی است که با گسترش فناوریهای نوین و شبکه جهانی اینترنت شاهد پیشرفتهای چشمگیری بوده است. امروزه کاربرد شبکه جهانی تنها به جست و جوی مطالب و ارائه اطلاعات محدود نمیشود. گسترش روزافزون فناوریهای نوین که در این شبکه ارائه میشوند سبب پیدایش زمینههای جدید در این عرصه شده است. ترجمهی برخط، تحت شبکه یکی از این زمینههای نوین است که در حال حاضر دوران ابتدایی تک...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم انسانی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023