نام پژوهشگر: علی محمىد زارع

بهبود مدل جابه جایی کلمات در سیستم ترجمه ماشینی آماری و بررسی تاثیر آن بر روی سیستم های بر خط
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1391
  ندا نورمحمدی   شهرام خدیوی

یکی از کلیدی ترین و چالش برانگیزترین مسائلی که یک سیستم مترجم آماری با آن مواجه است عبارت است از اینکه چگونه واحدهای (کلمه یا عبارت) ترجمه شده را در ترتیبی که با ساختار دستوری زبان مقصد مطابقت دارد در جمله مقصد قرار دهد. این مدل تحت نام «مدل جابه جایی» کلمات یاد می شود. در این پژوهش سعی شده است با بررسی مدل های جابجایی مطرح و توسعه آنها، کیفیت سیستم ترجمه ماشینی بهبود داده شود. به عنوان گام نخست با بهره بردن از ویژگی «کلاس کلمات» و ترکیب آن با مدل لغوی سنتی، مدلی با نام «مدل مبتنی بر کلاس کلمات» توسعه داده شده است. تجربه حاصل از این روش حاکی از موثر بودن آن می باشد. رویکرد دیگری که برای بهبود مدل جابه جایی بررسی شد، استفاده از «قوانین دستی» در گام پیش پردازش می باشد. در این روش چندین قانون جدید معرفی شده که در این میان قانون «اسم-اسم» موثرترین قانون در بالا بردن کیفیت خروجی شناخته شد. علاوه بر این، یک مدل کاملا جدید با نام «مدل مبتنی بر شماره عبارت جاری» که نوآوری حاصل از این پژوهش می باشد معرفی گردیده است. هدف از این مدل در ابتدا (نسخه اول) بهبود مدل فاصله محور- غالبا به عنوان مدل پایه در تحقیقات در نظر گرفته می شود- بود ولی در ادامه در قالب نسخه ی دوم با مدل لغوی سنتی ترکیب گشته و آزمایشات بر روی آن انجام شد. این مدل در هر دو نسخه کارایی مثبتی را از خود نشان داد.