نام پژوهشگر: صابر امجدی

طراحی وپیاده سازی یک سیستم جهت تشخیص گوینده وابسته به مبن
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی 1389
  صابر امجدی   حسن فرسی

برای تشخیص گوینده معمولا از بخش صدا دار سیگنال صحبت استفاده می کنند ولی برای تشخیص دقیق تر و مستقل از متن گوینده باید از حروف صدادار خاصی استفاده کنیم که حتما در هر کلمه ایی باشد. ما در این پایان نامه از حروف خاصی برای تشخیص گوینده استفاده کرده ایم. همانطور که می دانیم در فارسی بعد از هر حرف بی صدا معمولا یک حرف صدادار وجود دارد که این حروف صدا دار شامل آ ، او ، ایی و حروف صدا دار کوچک َ ، ِ ، ُ می باشند. بنابراین برای تشخیص گوینده مستقل از متن پیدا کردن و استفاده از ویژگی های همین حروف کافی می باشد. ما برای تشخیص گوینده هم از مشخصات مربوط به مسیر صوتی و هم از مشخصات مربوط به منبع صوتی سیگنال های مربوط به این حروف استفاده کرده ایم. ما از رایج ترین روش برای تشخیص حروف یعنی ضرایب کپسترال مقیاس مل (mfcc) استفاده کرده ایم و برای تشخیص گوینده از روی فیلتر مسیر صوتی نیز از روش mfcc استفاده کرده ایم. برای تشخیص گوینده از روی سیگنال تحریک حنجره، روش ضرایب اکتاو ویولت سیگنال باقی مانده (wocor) را به کار بردیم که دلایل استفاده از آن در پایان نامه توضیح داده شده است.در نهایت با ترکیب این دو روش یک سیستم تشخیص گوینده مستقل از متن قوی را ارائه کرده ایم. به خاطر حساسیت زیاد تشخیص گوینده به نویز از روش تفریق طیفی اصلاح شده برای حذف نویز استفاده شده است.