نام پژوهشگر: نسرین یادگار خسرویه

استخراج ویژگی زمانی- فرکانسی جهت شناسایی دیداری مصوت های فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق 1392
  نسرین یادگار خسرویه   حسین مروی

در این پایان نامه روشی برای شناسایی مصوت های فارسی در کلمات تک سیلابی ارائه می شود. برای این منظور پس از جداسازی فریم های تصویر و انتخاب فریم هایی که مربوط به تلفظ مصوت موجود در کلمه تک سیلابی بودند و نیز استخراج ناحیه ای پیرامون لب ها، ویژگی های مختلفی همچون ضرایب کسینوسی و ضرایب موجک و ضرایب mfcc برای تشخیص مصوت ها در کلمات تک سیلابی استخراج گردید. پس از آن توسط روش کاهش ویژگی lsda، ویژگی ها را کاهش دادیم. در نهایت موثرترین ویژگی ها برای شناسایی مشخص گردید. در این تحقیق از پایگاه داده ای شامل کلمات تک سیلابی، که توسط گویندگان مختلفی ادا شده بود و شامل 580 ویدیو بود استفاده گردید. ویژگی های استخراجی به عنوان ورودی به شبکه عصبی اعمال شدند. بهترین نرخ شناسایی از محاسبه ضرایب mfcc از 1/4 بردار ضرایب dct بعد از اسکن زیگزاگ ماتریس ضرایب کسینوسی به دست آمد.