نام پژوهشگر: شکوفه دشتبانی

ساخت پیکره واژگانی حوزه فناوری ارتباطات و اطلاعات (فاوا) به زبان فارسی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده مهندسی 1391
  شکوفه دشتبانی   محرم منصوری زاده

در زبانشناسی رایانه ای پیکره، انباره ای از داده های متنی است که برای اهداف مختلفی مثل مطالعات فرهنگی یک زبان خاص، مطالعه تغییرات یک زبان با گذشت زمان، پروژه های پردازش زبان های طبیعی، پروژه هایی که مربوط به حوزه ی زبان شناسی است، ایجاد می شوند. در این تحقیق تمرکز ما بر طراحی و ساخت پیکره ی دو زبانه ی فارسی-انگلیسی حوزه ی فاوا است. این پیکره به صورت خودکار ساخته شده است و منابع آن اسناد تخصصی حوزه ی فاوا است. در این پژوهش نرم-افزاری برای ساخت پیکره طراحی شده است که هزینه و مدت زمان ساخت پیکره را کاهش می دهد علاوه بر این، نرم افزار ارائه شده قابلیت مدیریت پیکره را نیز برای کاربران فراهم می کند. از ویژگی های پیکره ی ساخته شده فراهم کردن یک مجموعه ی متمرکز از اسناد تخصصی است که می تواند در پروژه های مختلف حوزه ی فاوا استفاده شود. مهمترین مرحله ی ساخت پیکره-های چند زبانی ترازبندی داده های پیکره است. در این پروژه روشی برای ترازبندی جمله های پیکره ی فارسی تخصصی حوزه فاوا ?ict? و جملات انگلیسی پیکره ی تخصصی حوزه فاوا ارائه شده است. هدف این پژوهش طراحی یک سیستم ترازبندی برای استخراج جمله های متناظر دو زبان است. در این روش با استفاده از یک لغت نامه دو زبانی که ایجاد کرده ایم و تکنیک های هوش مصنوعی، امتیاز نشان دهنده شباهت دو جمله، محاسبه می شود. در نهایت اطلاعات مربوط به نگاشت جمله های دو مجموعه ی انگلیسی و فارسی در پایگاه داده ی پیکره ذخیره می گردد. آزمایش ها نشان می دهد که این تکنیک علاوه بر اینکه از نظر دقت مناسب است، تعداد جمله های کاندید را نیز کاهش می دهد. در انتها آماری از وضعیت فعلی پیکره ی فاوا ارائه می شود.