نام پژوهشگر: زینب اسماعیلیان

تشخیص نوع احساس از روی گفتار با استفاده از ویژگی های زمان – فرکانسی
پایان نامه دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد شاهرود - دانشکده برق و الکترونیک 1392
  زینب اسماعیلیان   حسین مروی

تشخیص احساس از روی سیگنال گفتار یکی از موضوعات جدید و چالش برانگیز در پردازش گفتار می باشد که نقش مهمی در ارتباط انسان و کامپیوتر دارد. استفاده از یک پایگاه داده جامع در سیستم تشخیص احساس از اهمیت زیادی برخوردار است. تاکنون پایگاه های داده مختلفی به زبان های آلمانی، انگلیسی، دانمارکی و سایر زبان ها ارائه شده اند اما پایگاه داده فارسی جامعی تاکنون مشاهده نشده است از این رو در این تحقیق پایگاه داده فارسی احساسی درام برای تشخیص احساس از روی گفتار ارائه شده است. این پایگاه داده شامل 748 جمله با 8 احساس عصبانیت، خستگی، نفرت، ترس، طبیعی، ناراحتی، تعجب وخوشحالی می باشد. جملات توسط 33 گوینده (18 مرد و 15 زن) بیان شده اند. به منظور ارزیابی و مقایسه ی پایگاه داده پیشنهادی و پایگاه داده معروف برلین، ویژگی های متداول عروضی و طیفی از جملات این دو پایگاه داده استخراج گردیدند. نوآوری های دیگر در این تحقیق، ارائه دو ویژگی زمان- فرکانسی جدید مبتنی بر وریوگرام و مل کپستروم دو بعدی به منظور تشخیص احساس از روی گفتار می باشد. درآزمایش های انجام شده، از الگوریتم انتخاب ویژگی مبتنی بر معیار fdr و الگوریتم lda استفاده نموده ایم. به منظور کلاسه بندی احساس های مختلف ازالگوریتم های lda، svm خطی و svm با کرنل rbf استفاده نموده ایم. بیشترین نرخ تشخیص از ترکیب ویژگی های وریوگرام (پیشنهادی) با ویژگی های عروضی و طیفی حاصل شده است که در پایگاه داده درام برای گویندگان مرد 34/57% و برای گویندگان زن 18/63% و درپایگاه داده برلین برای گویندگان مرد 43/90% و برای گویندگان زن 82/86% محاسبه شد.