نام پژوهشگر: نجمه صمدیانی
نجمه صمدیانی حمید حسن پور
بازشناسی نوری حروف در حوزه های گوناگون مانند تشخیص پلاک خودرو، امنیت(مانند تصدیق گذرنامه)، بارکد و سیستم های بانکی (چک)، نقش مهمی ایفا می کند و تا کنون روش ها و سیستم های متعددی برای تشخیص کاراکترها ارائه شده است. هدف این تحقیق، ارائه ی روشی می¬باشد که بتواند ارقام و حروف تایپی یک زبان را بدون محدودیت در نوع فونت و اندازه، شناسایی نماید. از مهم ترین چالش های سیستم های بازشناسی موجود، این است که دارای تعداد زیادی نمونه ی آموزشی و در نتیجه حجم بالایی از محاسبات هستند؛ زیرا هنگام آموزش هر یک از کاراکترها به چندین نمونه ی آموزشی از آن کاراکتر، نیاز دارد. هم چنین اگر این سیستم ها برای تشخیص کاراکترها با تنوع فونت های بیشتری توسعه یابند؛ خطای تشخیص، افزایش می یابد. بنابراین به سیستم بازشناسی¬ای نیاز داریم که قادر باشد علاوه بر کم بودن تعداد نمونه های آموزشی، در مقابل تغییر فونت، مقاوم بوده و خطای تشخیص آن در ازای افزودن فونت های جدید، تغییر آن¬چنانی نداشته باشد. در این پایان نامه، به بازشناسی ارقام و حروف تایپی انگلیسی می پردازیم. کاراکترهای تایپی در فونت ها و اندازه های مختلف نوشته می شوند که سبب می گردد شکل نوشتاری کاراکترهای مشابه با یکدیگر متفاوت باشد؛ بنابراین به یک سیستم بازشناسی با استخراج ویژگی های مناسب از کاراکترها، نیاز است تا بتواند با درنظر گرفتن این تفاوت ها، کاراکترهای مشابه را تشخیص دهد. در این تحقیق، با استفاده از یک بردار ویژگی ساده- مجموع مقادیر پیکسل های تک تک سطرها و ستون ها- و یک شبکه¬ی عصبی نگاشت خودسازمانده بدون ساختار پیچیده، توانستیم ارقام تایپی انگلیسی را در 30 نوع فونت و 11 اندازه ی متفاوت با دقت 99.47% و حروف تایپی انگلیسی را در 24 نوع فونت و 11 اندازه ی مختلف با دقت 97.73%، دسته بندی کنیم. شبکه¬ی عصبی نگاشت خودسازمانده، معمولاً از فاصله ی اقلیدسی برای مقایسه ی نمونه های یک کلاس استفاده می کند اما در این پایان نامه به جای استفاده از فاصله ی اقلیدسی، معیار شباهت برای مقایسه ی بین بردار مشخصه ی رقم ورودی و وزن نرون¬های مختلف، به کار برده می شود. هم چنین، به جای آموزش چندین نمونه از فونت ها و اندازه های مختلف، تنها یک یا دو نمونه برای آموزش در شبکه¬ی عصبی، مورد استفاده قرار می گیرد.