نام پژوهشگر: احسان مرتضوی صنوبری

بازشناسی قلم های فارسی با استفاده از ماشین بردار پشتیبان
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق 1391
  احسان مرتضوی صنوبری   حسین خسروی

هدف از این پژوهش، بررسی عمل بازشناسی قلم به منظور تشخیص قلم از روی تصاویر اسکن شده از سند ها می باشد. بازشناسی قلم یکی از بخشهای مهمِ سامانه ocr است و هدف از بازشناسی قلم تعیین نوع قلم استفاده شده در متن تایپی است. در این پایان نامه با ترکیب ویژگی های مختلف و استفاده از طبقه بند svm سعی داریم نتایج بازشناسی قلم را بهبود ببخشیم. در این پژوهش از روش های فیلتر گابور، تبدیل موجک، فرکتال چندبُعدی وsrf که یک روش مبتنی بر گرادیان می باشد، برای استخراج ویژگی استفاده و با یکدیگر مقایسه می شوند. روش srf ترکیبی از دو نقاب سوبل و روبرتز می باشد و از اطلاعات دامنه و فاز برای استخراج ویژگی استفاده می کند. همچنین در این روش ویژگی ها به خوبی در جهت های مختلف استخراج می شوند. در استخراج ویژگی به روش موجک، از موجک های مادر متفاوتی از جمله db1 و symlet استفاده و با یکدیگر مقایسه شده اند. روش استخراج ویژگی بعدی مبتنی بر فرکتال است، فرکتال یک روش مفید برای تعیین پیچیدگی های تصاویر است و از روش های گوناگونی از جمله شمارنده جعبه ها و گسترش برای محاسبه بعُد فرکتال در این پژوهش استفاده کرده ایم. یکی دیگر از روش های استفاده شده برای استخراج ویژگی فیلتر گابور است که در گذشته به کرات مورد استفاده قرار گرفته است. عیب اصلی فیلتر گابور محاسبات فراوان و زمان بر آن است در صورتی که روش های دیگر، دارای حجم محاسبات به مراتب کمتری بوده و بسیار سریعتر از فیلتر گابور برای استخراج ویژگی از بافت عمل می کنند. پس از اینکه ویژگی ها با استفاده از روش های مختلف استخراج شدند به وسیله طبقه بندهای svm و mlp قلم ها بازشناسی شده و نتایج حاصل از این دو طبقه بند با یکدیگر مقایسه می شوند. در بین ویژگی های مورد بررسی srf و موجک، سرعت خوبی را داشته و نتایج بهتری را هم ارائه می دهند، از طرف دیگر این دو ویژگی تفاوت های زیادی در نحوه استخراج دارند لذا خطاهای ناشی از این دو ویژگی همبستگی کمی خواهند داشت. با توجه به این موضوع ما این دو ویژگی را با یکدیگر ترکیب کردیم که نتایج آن نسبت به هر دو ویژگی بهبود قابل توجهی یافته است. میانگین نرخ بازشناسی برای روش rsw و با استفاده از طبقه بند svm برابر با 95.58% درصد است که 2.14 درصد از روش srf و حدود 11.25درصد از تبدیل موجک بهتر می باشد.