نام پژوهشگر: نسرین یادگار خسرویه
نسرین یادگار خسرویه حسین مروی
در این پایان نامه روشی برای شناسایی مصوت های فارسی در کلمات تک سیلابی ارائه می شود. برای این منظور پس از جداسازی فریم های تصویر و انتخاب فریم هایی که مربوط به تلفظ مصوت موجود در کلمه تک سیلابی بودند و نیز استخراج ناحیه ای پیرامون لب ها، ویژگی های مختلفی همچون ضرایب کسینوسی و ضرایب موجک و ضرایب mfcc برای تشخیص مصوت ها در کلمات تک سیلابی استخراج گردید. پس از آن توسط روش کاهش ویژگی lsda، ویژگی ها را کاهش دادیم. در نهایت موثرترین ویژگی ها برای شناسایی مشخص گردید. در این تحقیق از پایگاه داده ای شامل کلمات تک سیلابی، که توسط گویندگان مختلفی ادا شده بود و شامل 580 ویدیو بود استفاده گردید. ویژگی های استخراجی به عنوان ورودی به شبکه عصبی اعمال شدند. بهترین نرخ شناسایی از محاسبه ضرایب mfcc از 1/4 بردار ضرایب dct بعد از اسکن زیگزاگ ماتریس ضرایب کسینوسی به دست آمد.