ساخت وردنت فارسی در حوزه ی فاوا به کمک وردنت های دیگر

پایان نامه
چکیده

وردنت یک پایگاه داده ی لغوی بزرگ است که برای ابهام زدایی کلمات، بازیابی اطلاعات و ترجمه ی متون استفاده می-شود. این پایگاه داده ی لغوی شامل اسم، فعل، صفت و قید است که کلمات هم معنی را در مجموعه هایی به نام ترادف دسته بندی می کند. در این پژوهش روش های خودکار را برای استخراج دادگان حوزه ی فناوری اطلاعات و ارتباطات (فاوا) از وردنت عمومی انگلیسی پرینستون پیشنهاد می کنیم و در مرحله ی بعد آن را به منظور ساخت وردنت فارسی نگاشت می دهیم. مزیت روش خودکار کاهش دخالت عامل انسانی و در نتیجه سرعت بخشی به فرایند توسعه وردنت فاوا می باشد. به همین منظور، چندین روش استخراج خودکار بر اساس تعریف ترادف، روابط معنایی بین ترداف های وردنت، شباهت بین تعریف ترادف ها و تعاریف لغت نامه-های تخصصی موجود و بالاخره ترادف های برادر ارائه نموده ایم. نتایج پیاده سازی و ارزیابی این روش ها بر روی وردنت پرینستون نشان می دهد که استخراج دادگان فاوا دقت قابل قبولی به همراه داشته است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ترجمه ماشینی متون تخصصی حوزه فاوا از انگلیسی به فارسی به کمک وردنت

گسترش روابط بین المللی در جهان امروز و تفاوت های فرهنگی و زبانی موجود باعث افزایش نیاز به ایجاد ارتباط بین زبان ها شده است. مهم ترین ابزار برای ایجاد این ارتباط ترجمه است. ترجمه ماشینی در جهت خودکارسازی عمل ترجمه بکار برده می شود. عمل ترجمه ماشینی انگلیسی به فارسی با مشکلات متعددی مواجه است. برای کاهش این مشکلات راهکارهایی در این پایان نامه ارائه می شود. یکی از مشکلات شایع در ترجمه ماشینی عدم ا...

15 صفحه اول

ساخت نیمه خودکار وردنت افعال فارسی از وردنت دیگر مقوله های نحوی زبان فارسی

هم اکنون از وردنت به عنوان ابزاری قدرتمند در زمینه پردازش زبان طبیعی استفاده می شود. در این پژوهش درجهت فراهم آوردن منبعی برای پردازش های رایانه ای بر روی زبان فارسی، به دنبال ارائه ی الگویی برای ساخت نیمه خودکار وردنت افعال فارسی بوده ایم که هم بتوانیم به ساخت وردنت افعال نائل شویم و هم به الگوی ساخت فعل مرکب و رابطه ی میان اجزاء آن دست یابیم. به این ترتیب این پژوهش را می توان به حوزه ی معناشن...

15 صفحه اول

مشکلات انطباق دسته‌های‌‌هم‌معنای فارس‌نت با دسته‌های‌‌هم‌معنای وردنت پرینستون

در این پژوهش به بررسی مشکلات موجود در انتخاب معادل برای دسته‌های‌‌هم‌معنای (دسمعناهای) فارس‌نت پرداخته‌شد. اهمیت این پژوهش به این لحاظ است که نتایج آن می‌‌تواند در طرحهای آینده مربوط به تکمیل فارس‌نت و ساخت شبکه‌‌های‌واژگانی دیگر یا تخصصی مورد استفاده قرار گیرد. با توجه به وجود سه دسته از مشکلات جهت انطباق وردنتها بر همدیگر شامل الف. مشکلات ناشی از سختی در تمایز معنایی در وردنت مبدأ ب. مشکلات ن...

متن کامل

واژه های ویژۀ زبان فارسی: خلأهای موجود در انطباق واژگانی فارس نت با شبکۀ واژگانی پرینستون (وردنت)

این پژوهش به بررسی انطباق فارس نت با شبکۀ واژگانیِ انگلیسی پرینستون (وردنت) می پردازد و در پی پاسخ به پرسش های زیر است: آیا دسته های هم معنایی که در فارس نت بدون تطابق با وردنت اند، واژه های ویژۀ زبان فارسی اند؟ به عبارت دیگر آیا این واژه ها در زبان انگلیسی آمریکایی و یا شبکۀ واژگانی پرینستون واقعاً خلأ واژگانی به شمار می روند؟ پرسش دیگر اینکه این موارد را چگونه می توان تقسیم بندی کرد و درصد هرکد...

متن کامل

ساخت پیکره واژگانی حوزه فناوری ارتباطات و اطلاعات (فاوا) به زبان فارسی

در زبانشناسی رایانه ای پیکره، انباره ای از داده های متنی است که برای اهداف مختلفی مثل مطالعات فرهنگی یک زبان خاص، مطالعه تغییرات یک زبان با گذشت زمان، پروژه های پردازش زبان های طبیعی، پروژه هایی که مربوط به حوزه ی زبان شناسی است، ایجاد می شوند. در این تحقیق تمرکز ما بر طراحی و ساخت پیکره ی دو زبانه ی فارسی-انگلیسی حوزه ی فاوا است. این پیکره به صورت خودکار ساخته شده است و منابع آن اسناد تخصصی حو...

15 صفحه اول

پیکره متنی تطبیقی فارسی-انگلیسی حوزه تخصصی فاوا

در زبان شناسی، پیکره انباره­ای از داده ­های متنی است. در این مقاله، تمرکز ما بر طراحی و ساخت خودکار پیکره دو زبانه فارسی-انگلیسی است. ما نرم افزاری برای ساخت پیکره طراحی کرده­ ایم که هزینه و زمان ساخت پیکره را کاهش می­ دهد؛ به­ علاوه نرم­افزار ارائه شده قابلیت مدیریت پیکره را نیز برای کاربران فراهم می­ کند. در این مقاله، روشی برای ترازبندی جمله های پیکره فارسی تخصصی حوزه فاوا  و جملات انگلیسی پ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده مهندسی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023