نام پژوهشگر: زکیه شاکری
زکیه شاکری نوشین ریاحی
با افزایش روزافزون حجم اطلاعات در دنیای امروز و آسان شدن برقراری ارتباط در سرتاسر دنیا توسط شبکه جهانی، اهمیت داشتن مترجم های خودکاری که بتوانند به صورت بلادرنگ و در عین حال دقیق، این اطلاعات را به زبان های مختلف آماده کنند، به شدت احساس می شود. این زمینه با ظهور ماشین های مترجم آماری جان تازه ای به خود گرفت. روش های ترکیبی ترجمه نیز در سالیان اخیر طرفداران بسیاری پیدا کرده است، خصوصاً برای ترجمه زبان هایی مانند فارسی که ابزار و داده های مناسب برای ایجاد سیستم آماری مطلوب وجود ندارد. سیستم ترکیبی پیشنهاد شده در این پایان نامه که برای ترجمه بین جفت زبان های انگلیسی و فارسی طراحی شده است به دو روش، رویکردهای غالب ترجمه ماشینی یعنی رویکرد آماری و رویکرد مبتنی بر قاعده را با هم ترکیب می کند. در روش اول این دو رویکرد بصورت درهم تنیده با هم ترکیب می شوند بدین صورت که سیستم پایه آماری بوده و آنرا با استفاده از ویژگیهای زبان بهبود می دهیم. تحقیقات انجام شده نشان می دهند که برچسب pos موثرترین فاکتور زبانی در این نوع سیستم های ترکیبی است که متأسفانه برای زبان فارسی برچسب زن های موجود جوابگو نبودند. لذا در اولین گام یک برچسب زن pos فارسی مناسب با دقت بالا آماده نمودیم. سیستم ترجمه ترکیبی که از این ابزار استفاده می کند کیفیت ترجمه بهتری نسبت به سیستم آماری دارد. از سوی دیگر سیستم های آماری حال حاضر برای زبان هایی با ساختار گرامری مشابه بهتر عمل می کنند اما دو زبان فارسی و انگلیسی ساختارهای بسیار متفاوتی دارند و لذا سیستم ترجمه آماری آنها کیفیت خوبی ندارد. در روش ترکیبی پیشنهادی دوم از جابجایی کلمات در مرحله پیش پردازش استفاده شده است. بدین صورت که با استفاده از تکنیک های آماری، قواعد جابجایی کلمات در هنگام ترجمه از زبان مبدأ به مقصد را استخراج کرده و در یک مرحله پیش پردازش، ساختار زبان مبدأ را تغییر می دهیم تا شبیه به ساختار زبان مقصد شود. این سیستم ترکیبی نیز عملکرد بهتری نسبت به سیستم آماری از خود نشان داد.