شیما ح

نام پژوهشگر: شیما ح

سیستم تشخیص خودکار زبان صحبت شده از روی گفتار

پایان نامه دانشگاه تربیت معلم - تهران - دانشکده مهندسی 1393
شیما ح منوچهر کلارستاقی

تشخیص خودکار زبان در واقع مساله تشخیص زبان یک نمونه گفتار صحبت شده توسط سخنگوی نامعلوم است. تشخیص خودکار زبان می‏تواند به ارتباط بین مردم نواحی گوناگون کمک کند و کاربردهای مختلفی در توسعه گردشگری، تجارت آزاد، تقویت امنیت ملی از طریق پیش‏پردازش و فیلترنمودن مکالمات مشکوک، خدمات اورژانس، ترجمه همزمان در همایش‏ها و مکالمات بین‏المللی دارد. در این پایان‏نامه با کمک کلاسه‏بندی ویژگی‏های مختلف، سیستم تشخیص خودکار زبان، طراحی و پیاده‏سازی شده است. ویژگی‏های صوتی مورد نظر از فریم‏های متوالی سیگنال گفتار استخراج و ویژگی‏های آماری این فریم‏ها به عنوان بردار ویژگی در نظر گرفته می‏شوند. برای این منظور ویژگی‏های mfcc ، lpc وplp استخراج و مورد تجزیه و تحلیل قرا گرفته است. پس از استخراج این ویژگی‏ها، لیفترهای خطی و غیر خطی به ضرایب اعمال می‏شود. همچنین ترکیب دو به دو این ویژگی‏ها نیز برای تشخیص زبان استفاده شده است. بعد از استخراج ویژگی‏های مورد نظر، توسط کلاس‏بند مدل مخلوط گوسی و همچنین اعمال روشllr به عنوان یک روش پس‏پردازش ساده، برای تصمیم‏گیری مناسب‏تر از روی بردارهای امتیازات بدست آمده، شناسایی زبان مورد نظر انجام می‏گیرد. نتایج آزمایش‏ها نشان می‏دهد که ضرایب mfcc به همراه اعمال لیفتر غیر خطی و نیز ترکیب دو ویژگی می‏تواند کارایی سیستم را افزایش دهد. تاکنون روش‏های مختلفی برای شناسایی زبان گفتاری پیشنهاد شده است، که در بین همه آنها ضرایب کپسترال به درصد صحت بالاتری رسیده است. نتایج نشانگر دقت مناسب اعمال لیفتر سینوسی به ضرایب و نیز ویژگی‏های ترکیبی در تشخیص زبان می‏باشد.