نام پژوهشگر: احمد عطاران
احمد عطاران حسن فرسی
تشخیص جنسیت با استفاده از سیگنال گفتار احمد عطاران چکیده: طبقه بندیجنسیت درگفتار و بازشناسی گوینده به اندازه طبقه بندی احساسات گفتار مفید است زیرا هنگامی که مدلهای صوتی(آکوستیک) جداگانه برای مردان و زنان به کارگرفته شود کارایی بهتری خواهد داشت. با توجه به اینکه سکوت بین زن و مرد مشترک است بنا بر این سکوت از ابتدا حذف می گردد. این امر باعث کاهش حجم بار محاسباتی اضافی و همچنین افزایش نرخ بازشناسی می شود. برای حذف سکوت از یک روش ترکیبی انرژی تیگر و روش انرژی- آنتروپی استفاده شد. در بیشتر مقالات برای استخراج ویژگی های صوتی از روش ضرایب طیفی مل فرکانسی mfcc استفاده شده است که نتایج خیلی بهتری نسبت به روش های دیگر دارد. به همین دلیل از روش ضرایب طیفی مل فرکانسی mfcc و ضرایب دلتای مل فرکانسی?mfcc و دلتای دلتای مل فرکانسی ??mfcc استفاده می شود. همچنین با توجه به این که ضریب اول طیفی استخراج شده با انرژی فریم مرتبط است و در تعیین هویت مفید نیست این ضریب از بردار ویژگی ها حذف می شود . برای مدل سازی از روش مدل سازی مخلوط گوسی استفاده می شود ولی مدل مخلوط گوسی وابسته به تخمین اولیه میانگین ها و کوواریانس های مخلوط ها می باشد. در روش تخمین تصادفی مقادیر میانگین و واریانس نرخ بازشناسی حداکثر به70 درصد می رسد. رویکردی که در این مقاله برای جلوگیری از این مشکل پیشنهاد می گردد استفاده از چندین بار تخمین اولیه میانگین و کوواریانس می باشد. در بیشتر مقالات مطالعه شده بیشتر بر روی تخمین دقیق میانگین کار نموده اند. در روش پیشنهادی از تخمین دقیق میانگین استفاده می گردد و از آن برای تخمین کوواریانس استفاده می شود. نرخ بازشناسی جنسیت روش پیشنهادی به حداکثر 86.67 درصد رسیده است. واژگان کلیدی :حذف سکوت، ضرایب mfcc، مدل مخلوط گوسی mel frequency cepstral coefficients 1