ایجاد پیکره زبانی موازی به وسیله پیکره های قیاس پذیر
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
- نویسنده علیرضا تابع بردبار
- استاد راهنما محمد هادی صدرالدینی
- سال انتشار 1393
چکیده
امروزه پیکره های زبانی یکی از حیاتی ترین نیازها در زمینه ترجمه ماشینی می باشد. ساختار یک پیکره زبانی به این صورت است که از دو بخش تشکیل شده است. یک سمت آن را جملات زبان مبداء (در این پایان نامه زبان فارسی) و سمت دیگر آن را جملات زبان مقصد (در این پایان نامه زبان انگلیسی) تشکیل می دهد. به منظور تشکیل این پیکره زبانی ما از پایگاه دانش ویکی پدیا استفاده می کنیم. سپس یک شیوه مبتنی بر بازیابی اطلاعات که بر اساس برچسب گروه و لینک کار می کند به منظور دسته بندی مقالات مشابه استفاده می کنیم. پس از آنکه مقالات مشابه را دسته بندی کردیم، به وسیله یک سری خصیصه که در بر گیرنده ویژگی های مانند شباهت ترجمه و میزان شباهت از جهت ترازبندی می باشند برای امتیاز دهی جملات استفاده می کنیم. به منظور دادن وزن بهینه به هر یک از این خصیصه ها از یک مدل خطی استفاده کرده ایم.
منابع مشابه
پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی
Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...
متن کاملمقایسه تطبیقی پیکره های ایستاده فتحعلی شاه قاجار به رقم مهر علی با پیکره های انسانی در هنر سغدی
مهرعلی، یکی از نگارگران عصر فتحعلیشاه قاجار، در برخی از آثار خود، پیکره ایستاده پادشاه را با کمر باریک، شانههای پهن و عصای مرغنشان در دست راست مینمایاند. سغد، از سرزمینهای ایران باستان نیز در آثاری مانند سکه، سپر چوبی و نقاشیهای دیواری، پیکرههایی مزین به جواهرات، کمر باریک، شانههای پهن و عصای مرغنشان در دست راست معرفی میکند که شیوه روایی برخی از آنها متأثر از ادبیات حماسی شاهنامه است...
متن کاملتحلیل محتوای مقالات علوم پزشکی بر اساس مطالعه پیکره زبانی
1024x768 مقدمه: تحلیل محتوا برای مقایسه یک متن با متن دیگر، آثار یک نویسنده، با نویسندگان دیگر و با همان نویسنده، مقایسه متن های نوشته شده به یک زبان طبیعی با متون زبان دیگر و بررسی متون یک حوزه تخصصی به کار می رود، هدف پژوهش حاضر تحلیل محتوای مقالات علوم پزشکی و استخراج ساختار جملات در آن به منظور استفاده پژوهشگران بوده است. روش بررسی: این مطالعه از دسته مطالعات تحلیل محتوا بر اساس ساختار دستو...
متن کاملنقد کتاب کاربرد پیکره در تحلیل گفتمان
چکیده کاربرد پیکره در تحلیل گفتمان نوشتۀ پاول بیکر (2006) توسط انتشارات کانتینیوم (لندن و نیویورک) در 207 صفحه منتشر شده است. کتاب بر دو موضوع اصلی و ایجاد ارتباط بین آنها متمرکز است: تحلیل گفتمان و زبانشناسی پیکرهای. تحلیل گفتمان که ماهیتی میانرشتهای دارد، در سالهای اخیر مورد توجه بسیاری از زبانشناسان بهویژه پژوهشگران علاقهمند به مباحث جامعهشناسی زبان بوده است. پیکره زبانی مجموعهای...
متن کاملاستخراج اطلاعات از پیکره زبانی: معرفی پیکرۀ مقالههای علمیپژوهشی دانشگاه فردوسی مشهد
هدف: پردازش زبان طبیعی، استفاده در فرهنگنگاری، پیگیری تحولات زبانی و استخراج اطلاعات زبانی خاص از مهمترین کاربردهای پیکره است. هدف از انجام این پژوهش معرفی و توصیف چگونگی ساخت پیکرۀ مقالههای علمیپژوهشی است که نگارندگان پدید آوردهاند. روش: برای ایجاد پیکره، نخست نرمافزار پیکرهساز طراحی و ساخته شد. این نرمافزار انواع فرمت از جمله doc،docx ،rtf ،txt ...
متن کاملمدل سازی و پیکره بندی عوامل اثرگذار بر ایجاد اکوسیستم کارآفرینی پردیس دانشگاهی
موضوع ایجاد اکوسیستم کارآفرینی پردیس دانشگاهی، یکی از چالشهای پیشِ روی سیاستگذران توسعه کارآفرینی در نظام آموزش عالی محسوب میشود. هدف اصلی این پژوهش، مدلسازی و پیکرهبندی عوامل اثرگذار بر ایجاد اکوسیستم کارآفرینانه پردیس دانشگاهی، از طریق سطحبندی و تعیین میزان شدت تعاملات آنهاست. براین اساس روش تحقیق این پژوهش از لحاظ هدف، کاربردی و از منظر گردآوری اطلاعات، آمیخته-اکتشافی است. این پژوهش دا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023