نام پژوهشگر: امید هاشمی قوچانی
امید هاشمی قوچانی علیرضا سیدین
سیستم ها و نرم افزارهای بازشناسی نوری نویسه ها(ocr) هم اکنون بسیار متداول شده اند و در کاربردهای فراوانی که مبتنی بر تشخیص نوری علائم و نوشتارهای تایپی و دستنویس میباشند مورد استفاده قرار میگیرند. در مورد بازشناسی علائم و نوشتارهای زبان فارسی به ویژه دستنویس های فارسی این سیستم ها و نرم افزارها هنوز از دقت بازشناسی مناسبی برخوردار نیستند. بنابراین ما در این پایان نامه بر روی بازشناسی کلمات دستنویس فارسی تمرکز کرده ایم. کلماتی که در اینجا بازشناسی می شوند کلمات دستنویس نام 30 شهر از شهرهای استان های خراسان شمالی، رضوی و جنوبی می باشند. به علت عدم وجود چنین پایگاه داده ای، برای هر شهر 50 نمونه دستنویس از دستخط 50 فرد مختلف تهیه و از آنها به عنوان پایگاه داده در این پروژه استفاده کردیم. ما در این پروژه از رویکرد مبتنی بر در نظر گرفتن کل کلمه به عنوان یک عنصر واحد جهت بازشناسی کلمات استفاده کرده ایم و برای اولین بار از ویژگی های ماتریس glcm جهت اختصاص ویژگی در سیستم های بازشناسی نوری نویسه ها استفاده کردیم و به نرخ بازشناسی 75% برای کلمات دستنویس نام 30 شهر دست پیدا کردیم.