نام پژوهشگر: محمد علی بیگی
محمد علی بیگی سید محمد رضوی
شناسایی الگو شاخه ای از هوش مصنوعی است که با طبقه بندی و توصیف مشاهدات سروکار دارد. شناسایی الگو به ما کمک می کند تا داده ها (الگوها) را با تکیه بر دانش قبلی یا اطلاعات آماری استخراج شده از الگوها، طبقه بندی نماییم. بازشناسی نوری حروف یکی از کاربردهای شناسایی الگو می باشد. مسئله بازشناسی حروف الفبای فارسی سابقه ای نه چندان طولانی به همراه دارد. هدف از انجام این تحقیق بازشناسی زیرکلمات تایپی فارسی می باشد. کلمات فارسی از بخشهایی به نام زیرکلمه تشکیل شده است که در صورت بازشناسی آنها، کلمه به صورت کامل بازشناسی می شود. در این پایان نامه، برای بازشناسی زیرکلمات روشی ساده ارائه شده است. در این روش، حروف براساس نقاط و علائم بالا و پایین آن، به 10 گروه تقسیم شده و به دنبال آن زیرکلمات فارسی به گروه های هم علامت تقسیم می شوند. ابتدا نقاط و علائم زیرکلمه و مکان نسبی آنها تشخیص داده می شود و با توجه به آن گروه هم علامتها از مجموعه زیرکلمات فارسی انتخاب می شود. اگر این گروه فقط یک عضو داشته باشد، کلاس آن عضو به زیرکلمه ناشناخته نسبت داده می شود در غیر این صورت بدنه زیرکلمه ناشناخته با بدنه های زیرکلمات هم علامت مقایسه می شود. برای مقایسه، از ویژگیهای مکان مشخصه استفاده می شود. زیرکلمه ای که یکی از بدنه های منتسب به آن با بدنه زیرکلمه ناشناخته کمترین فاصله را داشته باشد، به زیرکلمه ناشناخته نسبت داده می شود. پایگاه داده ای که در اینجا استفاده شده است شامل 1000 زیرکلمه متداول در کلمات فارسی است.