بررسی کارآمدی روش های موجود در بازیابی اطلاعات بین زبانی فارسی-انگلیسی با استفاده از واژه نامه دوزبانه ماشین خوان

پایان نامه
چکیده

پژوهش حاضر به بررسی کارآمدی شیوه های موجود در بازیابی اطلاعات بین زبانی(بازبین)فارسی- انگلیسی با رویکرد واژه نامه دوزبانه ماشین خوان پرداخته است. این پژوهش کاربردی بوده و با استفاده از روش های پژوهش نیمه تجربی و تحلیل محتوا انجام شده است. در این پژوهش ضمن بررسی میزان تاثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو، میزان و نحوه این تاثیر با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که در این پژوهش بکار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک و برچسب زنی انواع کلام بوده است. جامعه آماری این پژوهش پیشینه های موجود در موتور جستجوی گوگل بوده است که با استفاده از 40 عبارت جستجو، بازیابی شده و آنگاه با استفاده از روش نمونه گیری مخزن سازی و انجام قضاوت های ربط، داده های مورد نیاز برای انجام این پژوهش مهیا شده است. آزمون فرضیه اول این پژوهش نشان داد که در هنگام ترجمه عبارت های جستجوی فارسی به انگلیسی با واژه نامه دوزبانه ماشین خوان، استفاده از روش ترجمه انتخاب اولین برابرنهاده منجر به دستیابی به میانگین متوسط دقت بازیافت(map) معادل 223/. شد که در مقایسه با شیوه انتخاب همه برابرنهاده ها که میانگین متوسط دقت بازیافت برای آن 168/. بود موجب کارآمدی بیشتر بازبین می گردد. آزمون فرضیه دوم نشان داد که اگرچه تحلیل مورفولوژیک واژه هایی که به وسیله واژه نامه ترجمه نشدند باعث افزایش ضریب دقت بازیافت می گردد اما تفاوت معناداری با عدم انجام این تحلیل ایجاد نمی نماید. بررسی فرضیه سوم این پژوهش نیز نشان داد که ترجمه عبارتی در مقایسه با ترجمه واژه به واژه باعث کارآمدی بیشتر بازبین فارسی- انگلیسی می گردد. نمرات میانگین متوسط دقت بازیافت برای این دو شیوه ترجمه به ترتیب 319/. و 223/. بود. نتایج دیگر این پژوهش نیز نشان داد که دگرنویسی واژه های فارسی ترجمه ناپذیر به حروف زبان انگلیسی و قرار دادن آنها در عبارت جستجوی نهایی در مقایسه با حذف آنها از عبارت های جستجو می تواند منجر به افزایش کارآمدی بازبین فارسی- انگلیسی به میزان 74% گردد. در نهایت بررسی های انجام شده نشان داد که بازبین فارسی- انگلیسی در بهترین حالت بازیابی، به 64% کارآمدی بازیابی یک زبانه عبارت های جستجوی انگلیسی دست می یابد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بررسی کارآمدی روش های موجود در بازیابی اطلاعات بین زبانی فارسی- انگلیسی با استفاده از واژه نامه دوزبانه ماشین خوان

در این پژوهش میزان تأثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت های جستجو به کار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخ...

متن کامل

طراحی و پیاده سازی یک سامانه بازیابی اطلاعات دوزبانه با استفاده از پیکره های زبانی (ویژه نامه ذخیره، بازیابی و مدیریت اطلاعات زمستان ۹۰)

بازیابی اطلاعات بین زبانی به فرایندی گفته می شود که طی آن یک کاربر، جستاری (یک واژه، عبارت، یا حتی جمله ای) را به یک زبان جستجو می کند درحالی که انتظار دارد نتایج جستجوی خود را به زبان دیگری دریافت نماید. یکی از مشکلات عمده کاربران فارسی زبان در استفاده از منابع موجود در فضای سایبر، عدم امکان بازیابی موضوعات مورد نظر است که این مسأله تا حد زیادی به حجم کم اطلاعات به زبان فارسی در این فضا برمی گ...

متن کامل

ترجمه هوشمند اسامی فارسی در بازیابی اطلاعات بین زبانی

با گسترش روزافزون استفاده از اینترنت، کاربران و جستجوگران اطلاعات، دیگر تنها به منابع اطلاعاتی که به زبان آنها نوشته شده اکتفا نمی کنند. بنابراین سیستم های بازیابی اطلاعات بین زبانی، این نیاز را برای کاربران برآورده می سازند. به این صورت که می توان تنها با دادن پرس وجو در یک زبان، اسناد با زبان های مختلف را بازیابی کرد. از بین پرس وجوهای کاربران، اسامی افراد از اهمیت خاصی برخوردار هستند. زیرا ت...

15 صفحه اول

مطالعه ی تطبیقی کلید واژه های فارسی و انگلیسی پایان نامه های دانشگاه علوم پزشکی اصفهان با اصطلاح نامه ها و سرعنوان های موضوعی پزشکی فارسی و انگلیسی

مقدمه: امروزه نقش نمایه به عنوان یک ابزار اساسی در بازیابی اطلاعات بر کسی پوشیده نیست. پژوهش حاضر به شناسایی میزان انطباق کلید واژه های فارسی و انگلسی در عنوان ها و چکیده های فارسی و انگلیسی پایان نامه های دانشگاه علوم پزشکی اصفهان با اصطلاح نامه ی پزشکی فارسی و سرعنوان موضوعی پزشکی (mesh) که مهم ترین اصطلاح نامه ها در حیطه ی پزشکی هستند، پرداخته است. روش بررسی: این پژوهش به روش تحلیلی بود که ب...

متن کامل

هم ترازی جملات دادگان فارسی-عربی با روش مبتنی بر واژه نامه دوزبانه

امروزه با گسترش یافتن وسایل ارتباط جمعی به ویژه اینترنت، نیاز و علاقه به ترجمه خودکار، افزایش یافته است. روش ها و سیستم های مختلفی برای ترجمه ماشینی به وجود آمده است که در سال های اخیر، روش ترجمه ماشینی آماری مطرح ترین آن ها می باشد. پیکره های چندزبانه، یکی از اساسی ترین منابع شاخه های مختلفی از پردازش زبان طبیعی مانند بازیابی اطلاعات چندزبانه و ترجمه ماشینی آماری می باشد. پیکره های چندزبانه ا...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده علوم تربیتی و روانشناسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023