تحلیل مرزهای هجایی سیگنال گفتار با استفاده از ویژگیهای مقاوم به نویز و خصوصیات پروزودیک

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
  • نویسنده غزال شیخی
  • استاد راهنما فرشاد الماس گنج
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1385
چکیده

با توجه به اینکه زبان فارسی زبانی نسبتا هجامحور است در این پروژه تقطیع سیگنال گفتار فارسی به واحدهای هجایی مورد توجه قرار گرفته است. هدف از این پروژه آن است که تنها با استفاده از سیگنال گفتار و کمیت های پروزودیک آن، تقطیع به واحدهای هجایی در محیط تمیز و آلوده به نویز با صحت قابل قبولی انجام شود. در این کار ابتدا انرژی زمان کوتاه سیگنال گفتار مورد پردازش قرار گرفته است. روش های مورد استفاده در این زمینه عبارتند از روش آستانه ثابت، روش آستانه متغیر، استفاده از تاخیر تجمعی و استفاده از نرم کننده فازی. نتایج حاکی از آن است که در محیط عاری از نویز روش نرم سازیِ فازیِِ تابع انرژی به ترتیب نسبت به روش های آستانه ثابت و آستانه متغیر بهترین صحت را نشان می دهد. با این حال نسبت درج مرز اضافه در آن زیاد است. در شرایط آلوده به نویز نیز روش تاخیر تجمعی علیرغم صحت پایین کمترین افت صحت را نشان می دهد. پس از آن روش نرم سازی فازی قرار می گیرد.امکان استفاده از منحنی فرکانس پایه در تقطیع هجایی نیز مورد بررسی قرار گرفته است. به این منظور از مدل های ساده منحنی فرکانس پایه در سطح کلمات استفاده شده است. نتایج نشان می دهند استفاده از این مدل ها به تنهایی، حتی در تقطیع کلمات مجزا به واحدهای هجایی صحت قابل-قبولی ندارد. بنابراین در نهایت امکان ترکیب ویژگی های منحنی فرکانس پایه(ناپیوستگی منحنی و مقدار میانگین آن) با روش های مبتنی بر تابع انرژی مورد بررسی قرار گرفته است. نتایج بررسی ها نشان می دهند استفاده از ناپیوستگی منحنی فرکانس پایه می تواند خطای درج مرز اضافه را در روش نرم سازی فازی کاهش دهد. استفاده از میانگین فرکانس پایه نیز می تواند میزان افت صحت را در این روش کاهش دهد.در نهایت نتایج حاکی از آن است در شرایط تمیز با استفاده از این روش درحدود %93 از مرزها با خطایی کمتر از 50 میلی ثانیه آشکار می شوند. ضمن آنکه خطای حذف و درج جمعا در حدود %10 است. در حضور نویز نیز از ترکیب روش تاخیر تجمعی با روش فازی به منظور افزایش میزان مقاومت به نویز استفاده شده است. در حضور نویز با نسبت سیگنال به نویز 10 دسی بل در حدود %7/86 از مرزها با خطایی کمتر از 50 میلی ثانیه آشکار می شوند. ضمن آنکه مجموع خطای حذف و درج در حدود %15 است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه‌گذاری ضرایب موجک و نرم‌سازی فازیِ تابع انرژی

امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمه‌ای هر روز بیشتر مورد توجه قرار می‌گیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی...

متن کامل

حذف نویز سیگنال گفتار

در بسیاری از شرایط ارتباط گفتاری، وجود نویز زمینه، موجب کاهش کیفیت و قابلیت فهم گفتار می گردد. وقتی گوینده و شنونده در محیطی ساکت و بدون نویز ارتباط برقرار می کنند، تبادل اطلاعات آسان و دقیق است اما قرار گرفتن در محیط نویزی تاثیرا ت نامطلوبی بر روی سیگنال گفتار خواهد داشت. از اینرو در سال های اخیر روش های متعددی برای مقاوم سازی بازشناسی گفتار و کاهش عدم تطبیق میان شرایط آموزش و آزمایش مطرح گرد...

15 صفحه اول

تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه‌گذاری ضرایب موجک و نرم‌سازی فازیِ تابع انرژی

امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمه‌ای هر روز بیشتر مورد توجه قرار می‌گیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی...

متن کامل

تحلیل سیگنال گفتار بیماران آلزایمری فارسی‌زبان

آلزایمر یک نوع اختلال عملکرد مغزی است که به‌تدریج توانایی‌های ذهنی بیمار تحلیل می‌رود؛ ازجمله علائم اولیة این بیماری فقدان حافظه، اختلال در تصمیم‌گیری و اشتباه در انتخاب واژگان درست است؛ بنابراین، پردازش سیگنال گفتار این بیماری توجه بسیاری از پژوهشگران را در دهه اخیر جلب کرده است. تشخیص بیماری آلزایمر با استفاده از سیگنال گفتار به فرهنگ و زبان و محتوای گفتار، جنسیت، سن، لهجه و بسیاری از عوامل د...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023