تخمین سریع ضرایب پیچش در هنجارسازی طول مجرای صوتی با استفاده از امتیاز به دست آمده از مدلسازی تشخیص جنسیت

Authors

  • رضا, شقایق پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
  • شکفته, یاسر پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
  • قلی پور, حسن پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
Abstract:

The performance of automatic speech recognition (ASR) systems is adversely affected by the variations in speakers, audio channels and environmental conditions. Making these systems robust to these variations is still a big challenge. One of the main sources of variations in the speakers is the differences between their Vocal Tract Length (VTL). Vocal Tract Length Normalization (VTLN) is an effective method introduced to cope with this variation. In this method, the speech spectrum of each speaker is frequency warped according to a specific warping factor of that speaker. In this paper, we first developed the common search-based method to obtain the appropriate warping factor over a HMM-based Persian continuous speech recognition system. Then pointing out the computational cost of search-based method, we proposed a linear regression process for estimating warping factor based on the scores generated by our gender detection system. Experimental results over a Persian conversational speech database shown an improvement about 0.54 percent in word recognition accuracy as well as a significant reduction in computational cost of estimating warping factor, compared to search-based approach.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

در این مقاله، یک سیستم بازشناسی کلمات جداگانه بررسی شده است. هدف این تحقیق، افزایش کارایی سیستم بازشناسی گفتار کودکان با استفاده از روش هنجارسازی طول مسیر صوتی است. این سیستم بازشناسی، برای استفاده در طراحی نرم‌افزار گفتاردرمانی ایجاد شده است به طوری که این نرم‌افزار با استفاده از سیستم بازشناسی، درست یا نادرست بودن تلفظ کودک را تشخیص می‌دهد و تلاش می‌کند تا با استفاده از بازخور...

full text

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

در این مقاله، یک سیستم بازشناسی کلمات جداگانه بررسی شده است. هدف این تحقیق، افزایش کارایی سیستم بازشناسی گفتار کودکان با استفاده از روش هنجارسازی طول مسیر صوتی است. این سیستم بازشناسی، برای استفاده در طراحی نرم­افزار گفتاردرمانی ایجاد شده است به طوری که این نرم­افزار با استفاده از سیستم بازشناسی، درست یا نادرست بودن تلفظ کودک را تشخیص می­دهد و تلاش می­کند تا با استفاده از بازخوردها گفتار کودک ر...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

تخمین تراوایی مخازن گازی کربناته با استفاده از نگارِ تشدید مغناطیسی هسته‌ای (NMR) و شاخص زون جریانی به دست آمده از امواج استونلی (FZI- استونلی)

تراوایی یکی از مهمترین پارامتراهای مخزنی برای توسعه و گسترش مخزن می باشد که نشان دهنده قابلیت سنگ مخزن در انتقال سیال هاست. به علت ناهمگن بودن مخزن، تخمین تراوایی همیشه با خطای زیادی محاسبه می شود. برای محاسبه تراوایی، این مقاله به دو بخش کلی تقسیم شده است. در بخش اول، با استفاده از نگاره تشدید مغناطیسی هسته ای ((NMR گروه‌های آرامش (معادل واحدهای جریان هیدرولیکی 12b0 یا HFU) تعیین شدند. مزیت...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 13  issue 1

pages  57- 70

publication date 2016-06

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023