نام پژوهشگر: الهام شهریارپور

بازشناسی مبالغ حرفی در چک های بانکی دستنویس فارسی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند 1390
  الهام شهریارپور   جواد صدری

بازشناسی دستنوشته ها از جمله موضوعاتی است که در بسیاری از کاربردهای تجاری و اداری نقش مهمی را ایفا می کند. در کشور ما با توجه به تلاشهایی که در سالهای اخیر برای دولت الکترونیک انجام گرفته، نیاز به بازشناسی متون دستنویس، خصوصا در سازمانهای دولتی مثل بانکها، ادارات پست و... بیش از پیش احساس میشود. از جمله مسائل مهم در زمینه تشخیص دستنوشتهها، بازشناسی مبالغ حرفی میباشد که حل آن پیشنیاز پیادهسازی و ایجاد سیستمهای پردازش اتوماتیک چکهای بانکی است. چک عمومیترین و متداولترین شکل پرداخت غیر نقدی در تمام کشورها از جمله ایران است و خواندن اتوماتیک چکهای بانکی به طور قابل توجه ای هزینه های پردازش و پیگیری حقوقی چکها را کاهش میدهد و در مقابل باعث افزایش دقت و سرعت پردازش در آنها میشود. هدف از این پایان نامه ارائه راه حل موثری برای بازشناسی مبالغ حرفی دست نویس در چک های بانکی فارسی و سپس پیاده سازی و ارزیابی راه حل مذکور می باشد. روش پیشنهاد شده مبتنی بر قطعه بندی مبلغ حرفی چک به چندین زیرکلمه و سپس بازشناسی زیرکلمات با مدل مخفی مارکوف (hmm) می باشد. مدل مخفی مارکوف یکی از روش های یادگیری ماشین است که استفاده از آن برای بازشناسی دست نوشته با استقبال زیادی از سوی محققان مواجه شده است. در روش ارائه شده، بعد از اعمال الگوریتم های پیش پردازش مانند حذف نویز، زیرکلمات موجود در مبلغ حرفی با آنالیزکردن اجزا متصل شان قطعه بندی می شوند. سپس در مرحله استخراج ویژگی، از پنجره متحرک برای اسکن کردن تصاویر زیرکلمات از راست به چپ استفاده می شود. به این صورت که هر تصویر به چند فریم تقسیم شده و از هر فریم تعدادی ویژگی آماری استخراج می گردد. سپس در مرحله بازشناسی زیرکلمات، توسط طبقه بندی کننده hmm راست به چپ گسسته و کوانتیزاسیون فازی برداری، لیستی برای هر زیرکلمه ی موجود در جمله تهیه می شود. در نهایت در مرحله پس پردازش با استفاده از قوانین گرامری چک های فارسی و الگوریتم مبتنی بر ویتربی مبالغ حرفی بازشناسی می شوند. برای آموزش سیستم از پایگاه داده استانداردی متشکل از2520 زیرکلمه و برای ارزیابی آن از 145 مبلغ حرفی استفاده می شود. نتایج آزمایشگاهی نشان می دهد که سیستم مذکور قادر به تشخیص زیرکلمات با نرخ 20/75 و مبالغ حرفی چک با نرخ 79/73 می باشد که نسبت به نتایج مشابه دارای عملکرد خوبی است.