نام پژوهشگر: محمدعلی تدین
محمدعلی تدین منصور ذوالقدری جهرمی
با ماشینی شدن کارها و کاهش نقش مستقیم انسان در به انجام رساندن پروژه های مختلف، لزوم وجود نرم افزاری هوشمند برای ترجمه روان متون انگلیسی به فارسی و بالعکس بر متخصصین، مهندسان و مترجمان، پوشیده نیست. یک کاربرد مهم ترجمه ماشینی که از ابتدا مطرح بوده، کاربرد نظامی است که شروع آن از وزارت دفاع آمریکا بوده است و هم اکنون نیزاز آن بطور جدی در بخش نظامی استفاده می شود. جالب است که اخیرا مترجم ماشینی فارسی هم به جمع پروژه های مورد استفاده بخش نظامی آمریکا اضافه شده است. یک کنفرانس در زمینه پردازش زبان طبیعی و ترجمه ماشینی برای زبان های مشابه فارسی و عربی نیز سالانه در آمریکا انجام می شود. ترجمه ماشینی به سیستم های کامپیوتری گفته می شود که وظیفه ی ترجمه خودکار متنی از یک زبان مبدا به زبان مقصد را به عهده دارند. سیستم های موجود برای ترجمه ماشینی را می توان به دو دسته کلی روش های مبتنی بر قانون و روش های مبتنی بر مجموعه متون تقسیم کرد. سیستم های مبتنی بر قانون روش هایی هستند که قواعد زبان های مبدا و مقصد بطور ثابت به آنها خورانده شده تا با استفاده از آنها ساختار جملات را در زبان مبدا تشخیص و به ترجمه آنها بر اساس ساختارهای موجود در زبان مقصد بپردازند. در سیستم های مبتنی بر مجموعه متون برای ترجمه یک جمله به مجموعه متون ترجمه شده قبلی مراجعه می شود تا بجای ترجمه لفظ به لفظ، یک ترجمه مشابه ترجمه انسانی بدست آید. یکی از پرچالش ترین مسائل در ترجمه ماشینی مسئله رفع ابهام معنایی است و یک سیستم مترجم ماشینی برای رسیدن به ترجمه مناسب باید این مرحله میانی در فرآیند ترجمه را با موفقیت پشت سر بگذارد. در این پایان نامه، روش رفع ابهام جدیدی را معرفی می کنیم که رویکرد آن رفع ابهام بر اساس روش های مبتنی بر مجموعه متون می باشد. راهکار ارائه شده یک روش یادگیری نظارتی است که با استفاده از الگوریتم های طبقه بندی و یادگیری ماشین اقدام به رفع ابهام معنایی می نماید. همچنین در این تحقیق برای ارزیابی روش پیشنهادی از یک مجموعه داده استفاده کرده ایم که در این مجموعه داده، روی 6 نام که هر یک مبهم هستند تاکید خواهیم کرد. به این منظور از مجموعه متونی استفاده کرده ایم که شامل این کلمات مبهم باشند.
محمدعلی تدین
چکیده ندارد.