نام پژوهشگر: مهدی آقایی قیوم آبادی

تلفیق روش های مبتنی بر تبدیلات زمانی-فرکانسی با اطلاعات خوب ساختار سیگنال صوتی به منظور بهبود درک لحن گفتار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده برق و الکترونیک 1392
  مهدی آقایی قیوم آبادی   حامد ساجدی

استفاده از الگوریتم های مبتنی بر فیلتربانک و با نرخ تحریک ثابت موجب می شود که اطلاعات فاز سیگنال صوتی به کاربران کاشت حلزون منتقل نشود و در نتیجه کاربران این سیستم ها درک صحیحی از لحن و آهنگ گفتار نداشته باشند. هدفگیری مطالعات اخیر غالبا به این سمت بوده است که الگوریتمی معرفی شود که بتواند اطلاعات فاز سیگنال را به کاربران این سیستم ها منتقل کند. از جمله می توان به الگوریتم های عبور از صفر و ‎iwzcs‎ اشاره کرد. بررسی الگوریتم های مبتنی بر مدولاسیون دامنه نشان می دهد که نرخ تحریک و دامنه تحریک نمی توانند به تنهایی اطلاعات فاز و در نتیجه لحن و آهنگ گفتار را به کاربر کاشت حلزون منتقل نماید. با استفاده از الگوریتم های عبور از صفر و ‎iwzcs‎ که علاوه بر نرخ و دامنه تحریک، زمانهای تحریک را با استفاده از اطلاعات ساختار خوب سیگنال صوتی بدست می آورند، فاز سیگنال صوتی را حفظ می کنند و در نتیجه لحن و آهنگ گفتار بهتر حفظ می شود. استفاده از تبدیل ویولت به جای فیلتربانک ، با توجه به خاصیت چندرزولوشنه بودن و عدم محدودیت برای استفاده از توابع سینوسی و کسینوسی موجب می شود که اطلاعات فرکانسی مورد نیاز برای تحریک، بهتر استخراج گردد. با تلفیق تبدیل ویولت و الگوریتم عبور از صفر، تغییرات فرکانس پیچ و اطلاعات فرمنت ها و در نتیجه لحن و آهنگ گفتار بهتر حفظ می شود.