نام پژوهشگر: مجتبی شریف نوقابی

تشخیص لهجه های مختلف فارسی بر اساس شکل موج گفتار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق 1392
  مجتبی شریف نوقابی   حسین مروی

یک سیگنال گفتار علاوه بر متن گفته شده حاوی اطلاعات زیادی از جمله سن و جنسیت احساسات و استرس، لهجه و گویش و سلامتی گوینده می باشد. یکی از مواردی که ممکن است باعث کاهش چشمگیر بازدهی یک سیستم تشخیص گفتار گردد تغییر لهجه آن است. به طوری که اگر یک سیستم با یک لهجه خاص آموزش دیده باشد و سپس با لهجه ای غیر از لهجه ای که با آن آموزش دیده است آزمایش شود، شاهد کاهش نسبتاً زیادی در بازدهی سیستم تشخیص گفتار خواهیم بود. با روشن شدن اهمیت مسئله تشخیص لهجه ها، اهمیت تدوین این پایان نامه نیز روشن می شود. در این تحقیق تعدادی ویژگی جدید مانند فرکانس مرکزی طیفی و دامنه مرکزی طیفی در مرحله استخراج ویژگی معرفی شده اند تا در کنار سایر ویژگی هایی که در تحقیقات گذشته استفاده شده اند از سیگنال گفتار لهجه دار استخراج شوند. علاوه بر این تعدادی ویژگی مقاوم به نویز به منظور تشخیص لهجه ها در محیط نویزی معرفی گردیده اند. در مرحله طبقه بندی علاوه بر استفاده از طبقه بندهای استفاده شده در تحقیق های قبلی از شبکه توابع بنیادی شعاعی نیز برای طبقه بندی استفاده شده است و یک پیشنهاد به منظور بهبود عملکرد طبقه بند ماشین بردار پشتیبان ارائه گردیده است. به عنوان آخرین روش پیشنهادی در مرحله طبقه بندی از روش ترکیب طبقه بندها استفاده شده است. برای انجام آزمایش های مختلف،داده های این پایان نامه از پایگاه داده farsdat انتخاب شده اند. نتایج آزمایش ها، نشان دهنده بهبود عملکرد سیستم در بیشتر روش های پیشنهادی است.