نام پژوهشگر: افسانه فضلی
شیوا تسلیمی پور علی حمزه
افعال مرکب، زیرمجموعه ای بسیار متداول از واژگان مرکب هستند که به دلیل خصوصیات ساختاری و معنایی ویژه ای که دارند، چالش هایی در برخورد با آنها در سیستم های محاسباتی وجود دارد. اخیرا، کارهایی در تشخیص خودکار افعال مرکب، در زبان هایی که از نظر محاسباتی غنی هستند، مثل زبان انگلیسی انجام شده است. هدف ما توسعه ی چنین تکنیک هایی برای برخورد خودکار با افعال مرکب در یک زبان مثل زبان فارسی است که منابع محاسباتی در آن بسیار محدود هستند. تخمین های محاسباتی در زبانی مثل فارسی که اغلب افعال آن را افعال مرکب تشکیل می دهند، بسیار مهم است. در این پایان نامه بر مجموعه ای بسیار متداول از افعال مرکب فارسی که به فرم ?اسم?+?فعل? هستند، متمرکز می شویم. ساخت افعال مرکب اغلب به صورت نیمه-زایا است: اگرچه یک فعل کمکی با تعداد زیادی از کلمات اسمی همراهی می کند، ولی بیشتر به ترکیب زایا با کلاس های معنایی خاصی برای تشکیل افعال مرکب تمایل دارد. در این پایان نامه یک معیار را که برای تعیین میزان قابل قبول بودن افعال مرکب (در زبان انگلیسی) معرفی شده است، به گونه ای توسعه می دهیم که از کلاس های معنایی کلمات استفاده کند. نشان می دهیم که این معیار جدید تعیین میزان قابل قبول بودن عبارات، بعنوان فعل مرکب که از کلاس های معنایی استفاده می کند، در تشخیص افعال مرکب فارسی بهتر از معیار اولیه عمل می کند. خصوصا نشان می دهیم که چنین کلاس هایی به طور خاص برای تعیین میزان قابل قبول بودن ترکیبات جدید یا غیر متداول، بعنوان فعل مرکب بسیار مفید هستند. در تعیین گروه-های معنایی کلمات از مدل فضای برداری استفاده می کنیم و معنای کلمات را در فضای کلمات به صورت بردار نشان می دهیم. همچنین نمایش برداری پیشنهاد می کنیم که از اطلاعات مربوط به ساخت افعال مرکب در بازنمایی برداری استفاده کند. با مشارکت دادن گروه های معنایی بدست آمده از این نمایش برداری، در معیار وابسته به کلاس معنایی، نتایج بهتری را در تشخیص افعال مرکب فارسی بدست می آوریم.
نرجس عسکریان علی حمزه
پردازش زبان طبیعی