نام پژوهشگر: محمد امین گیلاسی طرقبه

اثرات روش های خطی و غیر خطی کاهش ابعاد ویژگی بر بازشناسی ارقام فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - پژوهشکده برق و کامپیوتر 1392
  محمد امین گیلاسی طرقبه   سید محمد رضوی

امروزه با پیشرفت روز افزون علم ،حجم اطلاعات بسیار افزایش پیدا کرده است و تحلیل اطلاعات هزینه محاسباتی بالایی دارد. این مشکل در کار کردن با اطلاعات ابعاد بالا بوجود می آید و به آن نفرین ابعادی می گویند. در اکثر مسایل مربوط به بازشناسی، متغیر های کلیدی وجود دارند که به آن ها متغیرهای ذاتی گفته می شود و می توان با استخراج این متغیر ها ابعاد فضای مسئله را به طرز قابل ملاحظه ای کاهش داد. در این پایان نامه تمرکز اصلی برروی روشهای خطی و غیر خطی کاهش ابعاد ویژگی خواهد بود، بدین منظور، دو روش خطی (pca,lda) و سه روش غیرخطی (le, isomap, lle)مورد بررسی قرار می گیرند. این روش ها فرآیند استخراج ویژگی و کاهش ابعاد ویژگی را با هم انجام می دهند تا بتوان ارزیابی کرد که کدام روش می تواند در بازشناسی ارقام دستنویس فارسی دارای نرخ بالاتر و در استخراج متغیر های ذاتی موفق تر باشد. همچنین روش (lle) را که روشی بدون نظارت است به صورت روشی همراه با نظارت (slle) پیشنهاد می کنیم تا نرخ بازشناسی بهبود یابد. در این تحقیق از دو طبقه بند k نزدیکترین همسایه و شبکه عصبی برای طبقه بندی استفاده شده است. این بررسی ها بر روی مجموعه ارقام هدی انجام خواهد شد که دارای 60,000 نمونه آموزشی و 20,000 نمونه آزمایشی است.