نام پژوهشگر: آرزو ارجمندزاده

یک روش آماری برای ترکیب کلمات چندبخشی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی کامپیوتر 1393
  آرزو ارجمندزاده   مرتضی زاهدی

زبان فارسی شامل کلماتی است که از چند بخش تشکیل شده اند و رسم الخط استاندارد این کلمات چندبخشی به این صورت هستند که باید میان تمام اجزاء آن نیم فاصله باشد تا به صورت یک جزء واحد شناسایی شوند. پیروی از این رسم الخط استاندارد فارسی در خوانا بودن متن فارسی نقش بسزایی دارد و خواننده می تواند درک درستی از مفهوم متن داشته باشد. علاوه برآن، در پردازش زبان طبیعی و ازجمله ترجمه ماشینی، مشخص بودن محدوده کلمات در کارایی سیستم تاثیر بسزایی دارد.