نام پژوهشگر: حامد فضل اللهی آقاملک

بهبود نرخ بازشناسی ارقام دست نویس فارسی با استفاده از روش های ادغام در سطح ویژگی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و کامپیوتر 1391
  حامد فضل اللهی آقاملک   سید محمد رضوی

هدف یک سیستم بازشناسی الگو، قرار دادن الگوها با کمترین خطا، در کلاس مربوط به خودشان است. بازشناسی ارقام دستنویس فارسی یکی از مسائل مهم در حوزه بازشناسی الگو می باشد. تحقیقات در این زمینه چندین دهه است که آغاز شده است و هنوز هم در حال تحول می باشد. در سیستم های اولیه بازشناسی الگو از یک ویژگی و یک طبقه بند استفاده می شد. این سیستمها برای بازشناسی الگوهای پیچیده و کاربردهای زمان حقیقی مشکل داشتند. استفاده از ادغام اطلاعات به منظور افزایش کارایی سیستمهای بازشناسی الگو، یک مسئله متداول در کاربردهای مختلف می باشد. در این ایده با استفاده از ترکیب و ادغام چند بردار ویژگی و تشکیل یک بردار ویژگی جدید، توصیف بیان الگو، برای طبقه بند آسان تر خواهد شد. در این پژوهش، چند هدف دنبال شده است. اول اینکه هزینه و زمان بازشناسی، نسبت به ترکیب طبقه بندها بهبود داده شود. هدف دیگر اینکه نرخ بازشناسی بهتری را نسبت به ترکیب طبقه بندها بدست آورده شود. در این تحقیق، از سه طبقه بند، طبقه بند بیز، طبقه بند 3 همسایه نزدیکتر و طبقه بند کمترین فاصله استفاده شده است. از یازده روش استخراج ویژگی متفاوت برای بازشناسی ارقام دستنویس فارسی استفاده شده است که عبارتند از، ویژگی هیستوگرام افقی، هیستوگرام عمودی، فاصله(distance)، پایه گرادیان(gradient base)، شمارش تلاقی(cross count)، تبدیل کسینوسی گسسته(dct)، تبدیل موجک(dwt)، تبدیل گابور، مکان مشخصه، زونینگ یا ناحیه بندی، و یک روش پیشنهادی هیستوگرام پنجره ای. برای پیدا کردن وزن های بهینه برای ادغام ویژگی از دو الگوریتم بهینه سازی، الگوریتم ژنتیک(ga) و الگوریتم جمیعت ذرات(pso) استفاده شده است. تابع برازندگی در این الگوریتم ها تعداد خطاهای طبقه بندی کننده می باشد و هدف کمینه کردن خطای طبقه بندی کننده می باشد. از دو روش کاهش ابعاد ویژگی، روش آنالیز مولفه اصلی(pca) و تحلیل تفکیک کننده خطی (lda) برای کاهش بعد بردار ویژگی استفاده شده است. دیتابیسی که در این پایان نامه از آن استفاده شده، دیتابیس هدی می باشد. این دیتابیس شامل 102352نمونه می باشد که از 60،000 نمونه برای آموزش طبقه بندی کننده و20،000نمونه جهت آزمایش استفاده شده است. از خوشه بندی (k-means) برای کم کردن تعداد نمونه های آموزشی استفاده شده است این کار کمک به سریعتر شدن زمان پردازش برای بازشناسی می شود.