نام پژوهشگر: ملیحه قیدی
ملیحه قیدی ابوالقاسم صیادیان
درسیستم های بازشناسی گفتار انتخاب واحد گفتاری مناسب، از اهمیت ویژه ای برخوردار است. جهت انتخاب واحد آکوستیکی مناسب، در نظر گرفتن ساختار و ویژگی های زبان مورد استفاده، بسیار مهم است. با توجه به این که ساختار هجایی زبان فارسی تقریبا همانند زبان های هندی، چینی و ژاپنی ساده و محسوس است، در این تحقیق، واحد زیر کلمه نیم هجا به عنوان واحد آکوستیکی مناسب در زبان فارسی مورد توجه ما قرار گرفته است. با توجه به اینکه پایگاه داده گفتاری مبتنی بر نیم هجاها در زبان فارسی موجود نمی باشد، تلاش های زیادی جهت طراحی و پیاده سازی پایگاه داده گفتاری مناسب مبتنی بر نیم هجاها در طی انجام این تحقیق، صورت گرفته است. برای ارزیابی مدل ها، داده های گفتاری مربوط به دو گوینده زن و دو گوینده مرد ضبط شده و به صورت با سرپرستی در سطح واکه و نیم هجا برچسب زده شده است.در این پایان نامه، به عنوان اولین قدم جهت تشخیص واحدهای نیم هجا در سیگنال گفتار، به آشکارسازی و بازشناسی واکه ها پرداخته شده است. سعی شده با ترکیب روش ماشین های بردار پشتیبان و روش استفاده از ویژگی های آکوستیکی ، کارایی سیستم در این بخش تا حد ممکن بهبود داده شود. از پارامترهای آکوستیکی نظیر انرژی میان گذر به دلیل ویژگی های مناسبی چون سادگی محاسبات و ناوابسته بودن به گوینده، به منظور تشخیص اولیه محل واکه ها استفاده شده است. سپس از قدرت متمایز سازی خوب ماشین های بردار پشتیبان جهت طبقه بندی واکه ها و تعیین مرز دقیق تر آنها، بهره مند شدیم و به نتایج بسیار مناسبی دست یافتیم. در این تحقیق، برای دادگان گفتار گسسته در صد خطای کل 68/1% و برای گفتار پیوسته در صد خطای کل 86/4% حاصل شد. در مقایسه با نتایج حاصل از دو روش دیگر یعنی مدل مارکوف پنهان و مدل قطعه بندی نرم بر روی همین پایگاه داده، در می یابیم که ماشین های بردار پشتیبان در کاربردهای طبقه بندی بسیار کارآمد هستند. البته دست یابی به دقت بالا با استفاده از این روش، مستلزم صرف هزینه محاسباتی بیشتر و زمان آموزش طولانی تر خواهد بود.