کاربرد روش استخراج ویژگی rootmel جهت تخمین سن افراد با استفاده از سیگنال گفتار
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق
- نویسنده عاطفه دهقانیان
- استاد راهنما حسین مروی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
تخمین سن بر اساس ویژگی های گفتار انسان، یک موضوع قابل توجه در سیستم های شناسایی گفتار اتوماتیک می باشد. مطالعاتی در زمینه ی تخمین سن گوینده صورت گرفته است ولی نیاز به کار های نوین بیشتری، خصوصا برای گوینده های فارسی زبان، می باشد. در تخمین سن، مانند سایر سیستم های پردازش گفتار، با دو چالش مهم مواجه هستیم: یافتن یک روش مناسب برای استخراج ویژگی و انتخاب یک روش قابل اطمینان برای کلاسه بندی. هدف اصلی از این تحقیق استفاده از ویژگی root mel ferequency cepstral coefficients جهت بخش استخراج ویژگی در یک سیستم تخمین سن و یافتن بهترین مقدار برای داشتن درصد خطای کمتر می باشد؛ و همچنین مقایسه ی عملکرد این ویژگی با سایر ویژگی های متداول نظیر mfcc معمول، plp و lpc نیز مورد بررسی قرار گرفته است . برای استخراج ویژگی، کل سیگنال صوت را به کوچک ترین جزء آن، یعنی واج ها، تفکیک می کنیم و عملیات استخراج ویژگی و رده بندی را بر سیگنال مربوط به واج ها انجام می دهیم. از کلاسه بند به روش های تفکیک پذیری خطی و فواصل mahalanobis استفاده شده است. نتیجه آزمایشات انجام شده بر پایگاه داده ی farsdat به خطای کمترین 28.69 % بازای ریشه ی 0.006 در استفاده از روش rootmfcc و تاثیر مثبت تفکیک سیگنال صوتی به واج های تشکیل دهنده ی آن، در کاهش خطا می باشد.
منابع مشابه
تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...
متن کاملاستخراج ویژگی های مقاوم از سیگنال گفتار
در این پایاننامه دو روش استخراج ویژگی جدید که برای بازشناسی گفتار مفید است، ارائه شده است. ایده اصلی این پایاننامه، ارائه یک ساختار منعطف برای بانک فیلتر میباشد که به دادههای آموزشی وابسته است. درحالیکه سایر روشهای استخراج ویژگی نظیر mfcc، ساختار بانک فیلتر ثابت و غیرمنعطفی را ارائه میدهند. برای پیادهسازی هر دو ایده، ابتدا، تعدادی فیلتر یکسان در نظر گرفته میشود. سپس، در روش اول، برمبنا...
تخمین سن تقویمی با استفاده از روش دمرجیان در افراد 5 تا 16 ساله شهر رشت
Introduction: Age estimation plays a critical role in dentistry especial in orthodontics, pediatric Dentistry and other majors such as archaeology, etc. The aim of this study was to evaluate the accuracy of dental age estimation in 5-16 years-old children and adolescents in Gilan using Demirjian method. Methods: This retrospective cross-sectional study was carried out on 314 panoramic radiogra...
متن کاملارائه یک روش جدید دو مرحله ای جهت تخمین هوشمند سن افراد
Intelligent age estimation via face images has become an important research topic in machine vision and pattern recognition fields because it has a key role in many applications such as customer behavior analysis in a business intelligence system. Age estimation is a process which analyses an individual face image and estimates his/her age based on the year measure. The age estimation process ...
متن کاملتشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر
گفتار ابزار اولیه ارتباط بین انسان میباشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگیهای تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت میباشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقهبندی میباشد. پس از استخراج ویژگیهای پرکا...
متن کاملتشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها
تشخیص لهجه از روی شکل موج گفتار یکی از شاخه های نسبتا جدید در علم پردازش گفتار است.تشخیص لهجه می تواند تا حد زیادی باعث بهبود سیستم های بازشناخت گفتار شود.همانند هر سیستم بازشناسی، فرآیند تشخیص لهجه نیز شامل سه مرحله پیش پردازش، استخراج ویژگی و طبقه بندی است.در این مقاله سه روش کارآمد استخراج ویژگی شامل دامنه مرکزی طیفی (scm) ، مشتق اول آن (∆scm) و تبدیل zak روی سیگنال گفتار اعمال شده اند و کار...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023