بهبود بازشناسی کلمات مجزا در سامانه های تلفن گویای گفتاری در زبان فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
- نویسنده حمید اقبال زاده
- استاد راهنما فریبرز سبحان منش رضا بوستانی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
یکی از موثرترین راه های افزایش دقت سیستم های بازشناسی گفتار کلمات مجزا، به کارگیری اطلاعات آوایی (به صورت آماری ) می باشد. بازشناسی گفتار در سامانه های تلفنی در حالت کلی به دلیل دامنه فرکانسی پایین تر، نویز بیشتر و افزایش پیچیدگی و انواع نویز های موجود، پیچیدگی و چالش های بیشتری دارد . برای کاربردهای بازشناسی گفتار روش های مختلفی بر اساس مدل های آوایی متنوع پیشنهاد شده اند که هر یک سعی می کنند بخشی از سطوح اطلاعات آوایی را پوشش دهند . هرچند مدل های آوایی تا حدود زیادی قادرند ساختارهای موجود در آوا را مدل سازی کنند ولی هرکدام از آن ها فقط پدیده های خاصی را پوشش می دهند . هیچ کدام از این مدل های آوایی به تنه ایی قادر نیستند همه پدیده های آوایی را به طور هم زمان در چارچوب یک مدل احتمالاتی بگنجانند . یکی از مهمترین فاکتورهای یک مدل آوایی، دادگان آموزشی آن می باشد که بر اساس دامنه، مدل آوایی، بوسیله آنها آموزش می بیند . در این پژوهش برآنیم تا ترکیبی از مدل های آوای ی مختلفی را با روش های مطرح که کاربرد فراوانی در بازشناسی گفتار دارد، آموزش داده و بر اساس تفاوت در دادگان آموزشی، به عنوان یک فاکتور مهم مورد تحقیق قرار دهیم . هدف از این کار، قرار دادن اطلاعات و پیچیدگی های خطوط انتقالی مخابراتی و نویز های مربوطه در داخل مدل و یاد دادن این پیچیدگی ها به مدل آوایی، و سپس بررسی افزایش دقت مورد نظر می باشد . بدین ترتیب که بر فرض صحیح بودن روش بازشناسی در این دامنه و ثابت ماندن آن، تغییرات دادگان آموزشی چه تغییری می تواند ایجاد کند. در ادامه، به ارائه ایده ای خواهیم پرداخت که ا ز طریق آن، از روی تشخیص روشن -خاموش بودن حالت مدل بهینه مربوط به آنرا بارگزاری می نمائیم.
منابع مشابه
مدلسازی بازشناسی واجی کلمات فارسی
Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...
متن کاملساخت موضوعی کلمات مشتق در زبان فارسی
ساخت موضوعـی بـه فهرست موضوعهـای یک محمـول اطلاق میشود. مثلاً، فعل «خورد» دو موضوع و فعل «داد» سه موضوع در ساخت موضوعی خود دارد. معمولاً ساخت موضوعی افعال پس از افزودهشدن یک وند اشتقاقی به آنها تغییر میکند، بهگونهای که ساخت موضوعی مشتق حاصله با ساخت موضوعی کلمۀ پایه متفاوت است. در مقالة حاضر، ساخت موضوعی مشتقات فعلی زبان فارسی و تأثیر وند افزایی بر ساخت موضوعی کلمة پایه را مطالعه میکنیم. چ...
متن کاملارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب
جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح میگردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده بندی مبتنی بر خصیصه (Attribute-based Cla...
متن کاملبررسی ترمیمهای گفتاری در زبان فارسی
ترمیم، یکی از پدیدههای رایج در مکالمات روزمره همه زبانها و از جمله زبان فارسی است. ترمیم جایگزینی است برای گفتار تولید شده قبلی که گوینده یا فرد دیگری در گفتگو بیان میکند. مطالعه ترمیم، بخشی از حوزه مکالمه کاوی است که گفتگوهای روزمره را در قالب دادههای صوتی و تصویری مطالعه میکند. پژوهش حاضر به دنبال مشخص کردن انواع ترمیمها و جایگاه آنها در توالی نوبتها در گفتگوهای تلویزیونی زبان فارسی...
متن کاملبررسی ترمیم های گفتاری در زبان فارسی
ترمیم، یکی از پدیده های رایج در مکالمات روزمره همه زبان ها و از جمله زبان فارسی است. ترمیم جایگزینی است برای گفتار تولید شده قبلی که گوینده یا فرد دیگری در گفتگو بیان میکند. مطالعه ترمیم، بخشی از حوزه مکالمه کاوی است که گفتگو های روزمره را در قالب دادههای صوتی و تصویری مطالعه میکند. پژوهش حاضر به دنبال مشخص کردن انواع ترمیم ها و جایگاه آنها در توالی نوبتها در گفتگوهای تلویزیونی زبان فارسی و...
متن کاملبازشناسی علائم دینامیک مجزا در زبان اشاره فارسی
زبان اشاره اصلیترین راه ارتباطی افراد ناشنوا با یکدیگر میباشد. فراهمکردن ابزاری جهت ترجمهی این زبان به متن یا گفتار، سایر افراد را قادر میسازد تا بتوانند با ناشنوایان ارتباط برقرار نمایند. علائم موجود در زبان اشاره به دو دستهی ثابت و پویا تقسیم میشوند. دستهی اول شامل حروف الفبای هر زبان میباشد که توسط حالت دست مشخص میشوند. در حالی که هر کدام از علائم موجود در دستهی دوم بیانگر مفهومی ...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023