نام پژوهشگر: علیرضا تابع بردبار
علیرضا تابع بردبار محمد هادی صدرالدینی
امروزه پیکره های زبانی یکی از حیاتی ترین نیازها در زمینه ترجمه ماشینی می باشد. ساختار یک پیکره زبانی به این صورت است که از دو بخش تشکیل شده است. یک سمت آن را جملات زبان مبداء (در این پایان نامه زبان فارسی) و سمت دیگر آن را جملات زبان مقصد (در این پایان نامه زبان انگلیسی) تشکیل می دهد. به منظور تشکیل این پیکره زبانی ما از پایگاه دانش ویکی پدیا استفاده می کنیم. سپس یک شیوه مبتنی بر بازیابی اطلاعات که بر اساس برچسب گروه و لینک کار می کند به منظور دسته بندی مقالات مشابه استفاده می کنیم. پس از آنکه مقالات مشابه را دسته بندی کردیم، به وسیله یک سری خصیصه که در بر گیرنده ویژگی های مانند شباهت ترجمه و میزان شباهت از جهت ترازبندی می باشند برای امتیاز دهی جملات استفاده می کنیم. به منظور دادن وزن بهینه به هر یک از این خصیصه ها از یک مدل خطی استفاده کرده ایم.