نام پژوهشگر: احمد معینی رودبالی

طراحی و پیاده سازی سخت افزاری یک روش شناسایی برخط گوینده در بستر پردازشگر سیگنال tms320c55xx
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق 1394
  احمد معینی رودبالی   هادی گرایلو

شناسایی گوینده یکی از شاخه های پردازش گفتار می باشد که کاربرد زیادی در سیستم های امنیتی مبتنی بر پردازش گفتار دارد. در طول چند دهه اخیر تلاش های زیادی برای بهبود کارایی و افزایش دقت سیستم های شناسایی گوینده انجام شده است. اگر چه در اغلب پژوهش ها تمرکز بر افزایش درصد شناسایی و بهبود کارایی سیستم می باشد، با این وجود کمتر بر اهمیت برخط بودن و پیاده سازی سخت افزاری سیستم های شناسایی گوینده تاکید شده است. تمرکز این پایان نامه بر روی پیاده سازی برخط سیستم شناسایی گوینده بر روی یک سیستم سخت افزاری مبتنی بر پردازشگر سیگنال tms320c5509a می باشد. پس از بررسی های انجام شده، روش های طیفی زمان کوتاه انتخاب شده و به صورت خاص از میان این دسته از روش های استخراج ویژگی، روش های mfcc و lpcc برای پیاده سازی سخت افزاری انتخاب شده اند. برای مدل کردن گوینده گان از مدل آمیخته گاوسی استفاده شده است. . اگرچه روش استخراج ویژگی mfcc در محیط بدون نویز قابلیت شناسایی گویندگان را تا 99 درصد دارد، اما در محیط های نویزی، کارایی سیستم به شدت کاهش پیدا می کند. علاوه بر این آموزش مدل های gmm با استفاده از پایگاه داده نویزی نیز باعث کاهش زیادی در درصد شناسایی سیستم می-شود. در آزمایش های انجام شده، داده های آزمایش به صورت مستقیم بر روی پردازنده بارگذاری شده است. نتایج نشان دادند که الگوریتم انتخاب شده قابلیت استفاده به صورت بر خط را دارد.