نام پژوهشگر: سمیرا مغانی

بهسازی گفتار با استفاده از ویونت
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق 1391
  سمیرا مغانی   حسین مروی

بهسازی گفتار یا speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. تاکنون چندین روش در زمینه بهسازی گفتار نویزی ارائه شده است. روش پیشنهادی ما در این پایان نامه، شبکه عصبی موجک (ویونت) می باشد. این روش، مدلی مبتنی بر تلفیق شبکه عصبی با تبدیل موجک می باشد و به عنوان جایگزین مناسب در شبکه های عصبی پسخورد جهت تخمین و تقریب توابع غیرخطی اختیاری پیشنهاد می شود. در شبکه استاندارد پسخورد تابع فعال سازی نرون لایه پنهان یک تابع سیگموئید است. حال آنکه شبکه های عصبی موجک توابع موجک را به عنوان توابع فعالسازی نرون های لایه پنهان از شبکه پسخور مورد استفاده قرار میدهند. در روش پیشنهادی دو حالت برای دسترسی به نویز در نظر گرفته شد. حالت الف، حالتی است که دسترسی مستقیم به نویز محیط وجود دارد و حالت ب، حالتی است که از تخمین نویز استفاده کرده ایم. روش پیشنهادی برای تخمین نویز، استفاده از تبدیل موجک می باشد. موجک استفاده شده در این مرحله دابیشز 5 (db5) می باشد. روش پیشنهادی برای دادگان فارسی پیاده سازی شده است و برای ارزیابی و عملکرد آن از سه معیار سیگنال به نویز، سیگنال به نویز قطعه ای وlog likellihood ratio (llr) استفاده شده است. در نهایت روش پیشنهادی با شبکه عصبی و ترکیب شبکه عصبی با موجک و روش موجک مقایسه شده است. بررسی نتایج و آزمایشات نشان دهنده عملکرد قابل قبول روش پیشنهادی است.