مدل کردن نوای گفتار فارسی با استفاده از روش های داده گرا و قانونگرا

پایان نامه
چکیده

هدف از انجام این پایان نامه، مدلسازی نوای گفتار فارسی با استفاده از روش های داده گرا، برای سیستم های تبدیل متن به گفتار فارسی می باشد. روش های داده گرای بکار گرفته شده، شامل منحنی های متعدد تقریب انطباقی (مارس)، شبکه عصبی و ماشین پشتیبان بردار می باشند. مارس، تکنیکی برای تخمین یک تابع با بعد بالا با داده های خلوت می باشد که از روی داده ها پارامترها و ساختار مدل را بدست می آورد و قابلیت تفسیر مدل را فراهم می کند. ماشین پشتیبان بردار قابلیت تعمیم بسیار بالایی دارد به طوری که در اکثر موارد، کارایی آن در آموزش و تست، تقریبا یکسان می باشد. شبکه عصبی در محیط های نویزی خیلی خوب عمل می کند اما امکان تفسیر خروجی ندارد. نوای گفتار شامل دیرش، فرکانس پایه و انرژی آن می باشد که معمولا مقدار دیرش برای هر واج گفتار تخمین زده می-شود و فرکانس پایه و انرژی به صورت یک منحنی برای کل گفتار، تولید می شود. مقدار دیرش هر واج، با استفاده از روش مارس، شبکه عصبی و ماشین پشتیبان بردار تخمین زده شد و با استفاده از نتایج مارس، اهمیت عوامل موثر در کشش و تعامل بین عوامل، مورد تحلیل واقع شد. با توجه به زیاد بودن تعداد داده ها و سرعت پایین ماشین پشتیبان بردار در آموزش و آزمایش، دو شیوه متفاوت بکار گرفته شد. در روش اول با استفاده از چندی سازی برداری در فضای ورودی، تعداد داده های آموزشی به میزان قابل توجهی کاهش یافت و در روش دوم، فضای خروجی با توجه به مقدار دیرش هر داده، به چند خوشه تقسیم شد و برای هر خوشه، یک مدل تخمین جداگانه، ایجاد گردید. هر دو روش زمان آموزش و تست سیستم را با حفظ کارایی کاهش دادند. به منظور تولید منحنی گام، از روش فوجی ساکی، تیلت و منحنی های قطعه قطعه استفاده شد. روش فوجی ساکی برای منحنی گام، دو جزء دستورات تکیه و عبارت را فرض می کند که هر کدام دارای پارامترهای خاص خود هستند. پارامترهای دستورات تکیه، برای هجاهای تکیه بر و پارامترهای دستورات عبارت، برای اولین هجای عبارت های نوایی گفتار تخمین زده می شود و با استفاده از این پارامترها، منحنی گام با بکارگیری فرمول فوجی ساکی، تولید می شود. به منظور تخمین پارامترها، روش های مارس، شبکه عصبی و ماشین پشتیبان بردار بکار گرفته شدند که نتایج آزمایش ها نشان داد، روش مارس قادر به تخمین کلیه پارامترهای فوجی ساکی نمی باشد. مدل تیلت، منحنی گام را به صورت دنباله ای از رویدادهای آهنگین فرض می کند. رویدادهای اصلی شامل تکیه زیروبمی (a) و نواخت های مرزی (b) هستند. هر دو نوع رویداد با پارامترهای زمان شروع رویداد، فرکانس پایه در لحظه شروع رویداد، میزان دیرش، اندازه و عدد تیلت مدل می شوند. با استفاده از این پارامترها و یکسری فرمول، شکل کنتور f0 برای این رویداد ها تولید می شود و سپس با اتصال کلیه رویداد ها به یکدیگر، کل منحنی گام تولید می شود. با استفاده از روش های یادگیری ماشین، پارامترهای تیلت برای کلیه هجاهای متن تخمین زده شدند. در روش منحنی های قطعه قطعه، برای هر واج منحنی گام تولید می شود و از اتصال کلیه این منحنی ها، منحنی گام برای کل گفتار بدست می آید. منحنی هر واج با استفاده از چند جمله ای درجه دوم تولید می شود و برای تخمین ضرایب این چند جمله ای ها، از روش های داده گرا استفاده می شود. در زمینه انرژی گفتار، ابتدا عوامل تاثیرگذار روی مقدار انرژی بررسی گردید و سپس با استفاده از آن عوامل، به مدلسازی منحنی انرژی پرداخته شد. منحنی انرژی گفتار نیز، با استفاده از روش منحنی های قطعه قطعه مدلسازی گردید که در آن برای هر واج، منحنی انرژی اش تولید می شود و از اتصال این منحنی ها، منحنی انرژی کل گفتار بدست می آید. منحنی هر واج با استفاده از چند جمله ای درجه دوم تولید می شود و برای تخمین ضرایب این چند جمله ای ها، از روش های داده گرا استفاده می شود. به منظور ارزیابی نتایج، تست شنیداری mos و همچنین معیارهای ضریب همبستگی و میانگین مربع خطا، محاسبه شد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تعیین نوع کاربری و پوشش اراضی بوسیله داده های لندست7(ETM+) با استفاده از روش شیء گرا (منطقه کاشان)

پدیده های بیو فیزیکی و دست ساخت بشر توسط روشهای پردازش تصویر قابل شناسایی و تفکیک می باشند. شناسایی پدید ه هایی ­مانند کاربری ­و پوشش اراضی به روشهای سنتی ­وقت گیر و پر هزینه است. درحالی که روشهای رقومی استخراج اطلاعات از داده های دور سنجی سریعتر و کم ­هزینه تر می باشد . امروزه، سنجنده های ماهواره ای علاوه بر ثبت اطلا عات طیفی، قادر به جمع آوری اطلاعات مکانی از پدیده های سطح زمین نیز می‌باشند، ...

متن کامل

تأثیر جنسیت بر درک نوای عاطفی گفتار

مغز زنان و مردان از نظر ساختار و عملکرد با یکدیگر متفاوت است. هدف از این مطالعه، بررسی تفاوت دو جنس در درک نوای عاطفی گفتار است. این مطالعه به صورت مقطعی- مقایسه‌ای بر روی 50 نفر در دو گروه مرد و زن صورت گرفت. پاسخ هر یک از گروه‌های مورد بررسی به مجموعه آزمون‌های تهیه شده ثبت شد. محرک‌های مورد استفاده در این پژوهش، جملات عاطفی (شاد، غمگین و خشمگین) بودند که به صورت معنی‌دار، بی‌معنی و فیلتر شده...

متن کامل

مدل سازیِ نوای گفتارِ کانونی در فارسی: رویکردی تولیدی ـ نقش گرا

مقالة حاضر تلاشی است در جهت مدل سازیِ نوای گفتارِ کانونیِ فارسی که با اتخاذ رویکردی تولیدی ـ نقش گرا یعنی رمزگذاری موازی و تقریب هدف (penta) انجام شده است. داده های مورد استفاده برای مدل سازی شامل 150 پاره گفتار است که در شرایط مختلف کانونی و غیرکانونی تولید شده اند. در راستای رسیدن به این هدف، از بازسازی کنندة pentatrainer2 تحتِ نرم افزار پِرَت (praat) استفاده شده است. این بازسازی کننده در قالب رویک...

متن کامل

تولید خودکار نوای گفتار به کمک مدل آمیختار عصبی-آماری با امکان انتخاب واحد در سنتز

در این مقاله با هدف ایجاد بهبود در عملکرد اولین ویرایش از سیستم تبدیل متن به گفتار طبیعی ارایه شده برای زبان فارسی، که در آن از یک شبکه عصبی بازگشتی برای تولید همزمان عوامل نوای گفتار (الگوی فرکانس گام، دیرش، انرژی و درنگ) و نیز سنتزکننده «مدل هارمونیک + نویز» با دادگان تک واحدی از دو واجی ها، برای تولید گفتار استفاده شده بود، چگونگی به کارگیری یک مدل آمیختار عصبی- آماری برای...

متن کامل

کالیبره کردن مدل های پیش بینی تصادفات با استفاده از یک روش ابتکاری

در فرایند مدل سازی آماری تصادفات، برآورد دقیق ضرایب ثابت مدل (کالیبره کردن) از اهمیت زیادی برخورد است. زیرا، این ضرایب میزان و چگونگی ارتباط متغیرهای مستقل با متغیر وابسته را بیان کرده و بهمین جهت تخمین نادرست آنها می تواند به ارایه نتایج غیرواقعی توسط مدل منجرگردد. برای تعیین ضرایب ثابت مدل های پیش بینی تصادفات، معمولاً از فرایندی موسوم به حداکثر کردن تابع درستنمایی استفاده می شود که در آن رو...

متن کامل

تعیین مؤلفه باقی¬مانده داده¬های گرانی¬سنجی با استفاده از روش مدل سازی نمودار احتمال

در این مقاله روش مدل‌سازی نمودار احتمال در برآورد مؤلفه باقی‌مانده  داده‌های گرانی‌سنجی منطقه‌ای در جنوب غرب زاگرس، به کار رفته است. بر اساس تحلیل داده‌ها و تغییرپذیری روند مدل برازش شده بر نمودار احتمال، مؤلفه‌های ناحیه‌ای و باقی‌مانده از یکدیگر تفکیک شده‌اند. تقریب مرتبه اول، دوم و بهینه از مؤلفه باقی‌مانده داده‌ها بر اساس مرزهای متفاوت حاصل از مدل‌سازی نمودار احتمال ترسیم شده است. در نقشه‌ها...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023