نام پژوهشگر: الهام امامی میبدی

بررسی میزان تنکی سیگنال گفتار به منظور کاربرد در بهسازی گفتار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  الهام امامی میبدی   حمیدرضا ابوطالبی

نمایش های تُنُک، ابزار قدرتمندی را در آنالیز و پردازش سیگنال های گفتار و صوت ایجاد کرده اند و تنکی به صورت یک مفهوم کلیدی و مهم در زمینه های مختلفی چون جداسازی کور منابع، فشرده سازی، نمونه برداری و آنالیز سیگنال در آمده است. هدف از این پایان نامه، بررسی تنکیِ سیگنال گفتار در حوزه های مختلف و استفاده از نتایجِ این بررسی در مسأله ی بهسازی گفتار است. با توجه به اینکه در کاربردهای مختلف، تعابیر متفاوتی از تنکی وجود دارد، از این رو ابتدا به بررسی و تشریحِ مفاهیم و اصول کلیِ تنکی یک سیگنال می پردازیم. در این راستا شش ویژگی را برای یک معیار تنکی بیان کرده و این شش ویژگی را مبنای مقایسه ی معیارهای مطرح در زمینه ی تنکی قرار می دهیم. با بررسی هایی که انجام می دهیم، سه معیارِ gini، hoyer و kurtosis به عنوان معیارهای کارا و مناسب در سنجش میزانِ تنکی انتخاب می کنیم. نتایج حاصل از اعمال این سه معیار به سیگنال های گفتار در حوزه های مختلف (شامل حوزه ی زمان، dct، mdct، stft، dwt، gabor، mclt)، تبدیل های dct و mdct را به عنوان حوزه هایی که تنک ترین نمایش از سیگنال گفتار را موجب می شوند، معرفی می نماید. همچنین نشان داده می شود که تبدیل dct در مقایسه با تبدیل mdct خطای کمتری را در بازسازی دارد. در ادامه ی این تحقیق، موضوعِ بهسازی گفتار در تنک ترین حوزه (حوزه یِ dct) بر اساس ویژگی های سیگنال گفتار مورد بررسی قرار گرفته است. بدین منظور پس از بررسی روش های کلاسیک آستانه گذاری در حوزه ی dct و مزایا و معایب آنها، یک الگوریتم آستانه گذاری بر اساس واکداری یا بی واکی هر فریم پیشنهاد و پیاده سازی گردیده و عملکرد آن در مواجهه با سیگنال گفتار نویزی (در شرایط مختلف) مورد ارزیابی قرار گرفته است.