اعمال روشهای بهبود گفتار به عنوان پیش پردازش جهت بالا بردن دقت بازشناسی گفتار فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه علم و صنعت ایران
- نویسنده محسن رحمانی
- استاد راهنما احمد اکبری
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1380
چکیده
کارایی سیستمهای بازشناسی در حضور نویز کاهش می یابد. در این پایان نامه روشهای مقاوم کردن سیستم بازشناسی در برابر نویز دسته بندی شده و از بین آنها روشهای مبتنی بر داه بررسی می شود. روشهای مختلف تفاضل طیف ، جبران کپسترال، نگاشت ضرایب و روشهای مبتنی بر ویژگیهای مقاوم تحلیل شده اند. یک رابطه جدید برای تسطیح نویز در تفاضل طیف و یک لیفتر جبران کننده برای وزندهی ضرایب کپسترال پیشنهاد شده است . همچنین ایده تخمین ویژگیهای مقاوم از ویژگی های نویزی ارائه شده است . نرخ بازشناسی با استفاده از پیش پردازنده های پیشنهادی افزایش داشته است . نگاشت ضرایب کپسترال نویزی با شبکه های عصبی نتایج قابل قبولی داشته است . بین همه روشها، نگاشت ضرایب تفاضل کپسترال میانگین با استفاده از شبکه عصبی بهترین نتیجه را دارد.
منابع مشابه
مقاوم سازی بازشناسی گفتار با اعمال پردازش زیرباندی
در این پروژه مقاوم سازی بازشناسی گفتار در محیط های نویزی بر مبنای پردازش زیرباندی بررسی شده است. مقاوم سازی بازشناسی گفتار یکی از مسائل مهم در این حوزه می باشد که کار بر روی ان همچنان ادامه دارد. از روش های گوناگونی به منظور تحقق یافتن این مهم استفاده می شود و ایده های متنوعی نیز در مقالات و تحقیقات ارائه می گردند. عیب عمده اکثر روشهای پیشهاد شده پیچیدگی زیاد و سرعت کم الگوریتم های آن است. ما د...
15 صفحه اولپایهگذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی
Although researches in the field of Persian speech recognition claim a thirty-year-old history in Iran which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...
متن کاملبازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی
حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود. برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تأثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی...
متن کاملمعرفی شبکه های عصبی پیمانه ای عمیق با ساختار فضایی-زمانی دوگانه جهت بهبود بازشناسی گفتار پیوسته فارسی
In this article, growable deep modular neural networks for continuous speech recognition are introduced. These networks can be grown to implement the spatio-temporal information of the frame sequences at their input layer as well as their labels at the output layer at the same time. The trained neural network with such double spatio-temporal association structure can learn the phonetic sequence...
متن کاملروش های اتصال گرای جدید بر گرفته از سامانه ادراک گفتار انسان به منظور بهبود بازشناسی گفتار ماشینی
بازشناسی خودکار گفتار در شرایط عدم تطابق دادگان آموزش و آزمون، یکی از چالش های مهم در این مورد است. به منظور کاهش هر چه بیشتر این عدم تطابق، روش های مرسوم، سعی در بهسازی گفتار یا تطابق مدل آماری دارند. در این زمینه از جمله روش های دیگر می توان به آموزش مدل در شرایط مختلف اشاره کرد. موفقیت در این روش ها، در مقابل کارایی سیستم درک و بازشناسی در انسان بسیار ابتدایی به نظر می رسد...
متن کاملرتبهبندی واجهای گفتار فارسی از نظر کارآیی در بازشناسی گوینده
در این مقاله، کارآیی واجهای گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآییها، رتبهبندی واجها صورت گرفتهاند. جهت برآورد کارآیی واجها، از یک معیاری که بهصورت نسب « فاصلة بینگویندهای» واجها به « فاصلة در گویندهای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیدهایم، استفاده شده است. آزمایشها و محاسبات لازم برای کلیه واجهای گفتار...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه علم و صنعت ایران
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023