نام پژوهشگر: سید احمد جکیان طوسی
سید احمد جکیان طوسی محسن کاهانی
در این پژوهش، برای اولین بار مدلی ترکیبی برای تراز بندی جملات، جهت ساخت پیکره های موازی انگلیسی-فارسی ارائه شده است. در حالت کلی چارچوب روش پیشنهادی، غیر وابسته به زبان های مبدأ و مقصد بوده و از آن می توان برای تولید پیکره های موازی، برای هر جفت زبان دیگر، نیز استفاده کرد. نتایج بدست آمده از پیاده سازی ها نشان می دهد که بکار بردن ویژگی های زبانی و غیر زبانی ، عملکرد سیستم را تا حد قابل قبولی بهبود خواهد بخشید. همچنین در این تحقیق میزان تأثیر استفاده از شباهت های طولی، ترجمه تحت اللفظی و نقش دستوری کلمات، به صورت مستقل یا ترکیبی، برای عملیات ترازبندی مورد بررسی قرار گرفته است. بکارگیری طبقه بندهای سلسله مراتبی در تشخیص نوع تراز بندی به عنوان یکی از شاخص های اصلی سیستم پیشنهادی محسوب می شود که موجب بالا رفتن دقت وسرعت عملیات تولید پیکره نسبت به سایر مدل ها می شود. از ویژگی های دیگر این روش، قابلیت توسعه پذیری آن است. به این ترتیب که می توان با گنجاندن خصوصیاتی (در بدنه بردارهای ورودی) که ممکن است در آینده برای تشخیص بهتر نوع تراز بندی مورد توجه قرار گیرند کیفیت سیستم ترازبندی را ارتقاء بخشید. با این حال، چالش اساسی این رهیافت و بسیاری از روش های پیشین، وجود سلایق متنوع در ترجمه متون است. این مسئله در برخی موارد موجب تولید جملاتی می گردد که مشابهت آن ها با متن اصلی در حد معنا بوده و تنها قابل درک و تشخیص برای انسان می باشد. در چنین وضعیتی کار استخراج جفت عبارات معادل، بسیار دشوار است. علاوه براین در مورد متونی که مقید به رعایت ساختار دستوری زبان فارسی و انگلیسی نمی باشند عملیات تشخیص جملات هم تراز ممکن است به خوبی انجام نپذیرد.