نام پژوهشگر: فهیمه جمهوری

استخراج ویژگی های زمانی- فرکانسی از سیگنال های گفتار فارسی جهت بهبود کارایی یک سیستم vad برای ارتباط انسان و ربات
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق 1393
  فهیمه جمهوری   حسین مروی

استفاده از ربات های اجتماعی در زندگی انسان ها افزایش یافته است و اصلی ترین راه ارتباط انسان ها با آنها ارتباط کلامی است. ربات های اجتماعی دارای میکروفونی هستند تا بتوانند سیگنال گفتار را برای ارتباط با انسان دریافت کنند. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص قسمت های گفتار در سیگنال های صوتی ضبط شده می باشد. هدف این پایان نامه طراحی یک سیستم آشکارساز فعالیت گفتاری است که بتواند با مشخص نمودن بخش های گفتار در یک محیط نویزی کارایی یک سیستم پردازش گفتار مورد استفاده برای یک ربات اجتماعی را افزایش دهد. در این پایان نامه، ویژگی های مختلفی جهت استخراج از سیگنال گفتار برای سیستم آشکارساز فعالیت گفتاری پیشنهاد شده است. این ویژگی ها با استفاده از ترکیب ویژگی انرژی با هر یک از ویژگی های ضرایب کپسترال فرکانس مل ریشه، ضرایب کپسترال فرکانس بارک، ضرایب پیش بینی ادراکی خطی و ضرایب پیش بینی ادراکی خطی تجدید نظر شده ارائه شده اند. روش پیشنهادی دیگری که در این پایان نامه مطرح شده بر مبنای ویژگی ویگنر ویل به عنوان یک روش استخراج ویژگی زمانی-فرکانسی است. این روش در مقایسه با روش های پیشنهادی مبتنی بر ویژگی انرژی و ویژگی های کپسترال، کارایی بهتری دارد. بنابراین برای افزایش کارایی روش های مبتنی بر ویژگی های کپسترال علاوه بر ویژگی انرژی، با ویژگی ویگنر ویل نیز ترکیب شده اند. برای ارزیابی کارایی روش های پیشنهادی، دادگان گفتاری فارس دات که یک پایگاه داده استاندارد و به زبان فارسی می باشد، به کار رفته است. با افزودن چند نوع متفاوت نویز به فایل های این پایگاه داده در شرایط مختلف نسبت سیگنال به نویز، مقاومت روش های پیشنهادی نسبت به نویزهای متفاوت سنجیده شده اند. آزمایشات نشان داده اند که برخی از روش های استخراج ویژگی پیشنهادی در این پایان نامه در مقایسه با روش متداول استخراج ویژگی ضرایب کپسترال فرکانس مل در محیطهای نویزی کارایی بهتری دارند.