نام پژوهشگر: یوسف حمدی سالمی
یوسف حمدی سالمی صادق رضایی
تسخیص فعال بودن صوت، vad، شاخه ای از علم پردازش سیگنال است. پردازش سیگنال از مهمترین فنون کاربردی دنیای امروز می باشد. علوم بسیاری از این فن بهره و سود فراوان دیده اند. به عنوان مثال میزان اهمیت این فن را در ارتباطات و مخابرات (امواج ماهواره ای، تلوزیونی، مخابراتی و بی سیمی) یا در پزشکی ( امواج قلبی، مغزی و اشعه اکیس) و در رایانه (تشخیص صدا و گوینده)، کاملاً مشهود است. ابتدایی ترین و مهمترین قدم در پردازش سیگنال تشخیص فعال بودن یا نبودن صوت(vad) است. vad مقدماتی ترین و اساسی ترین قدم در سیستمهای تشخیص صدا، تشخیص گوینده و سیستم های بهبود کیفیت صدا است. در تشخیص فعال بودن یا نبودن صوت (vad) مباحث آماری اساسی تری نقش را بازی کرده و تقریبا در تمامی کارهای مهم درvad از مبانی آماری همچون تحلیل طیفی، نظریه موجک، آزمون فرض ها، نظریات فازی و فیلترسازهای و مدلهای مخفی مارکوف (hmm)، استفاده شده است. در این پایان نامه نشان داده می شود که توزیع هایپربولیک تعمیم یافته (gh) جهت بیان رفتار داده های صوتی مناسب است، بطوریکه دیگر توزیع ها از جمله واریانس گاما، لاپلاس، کوشی و توزیع t که مولفین قبلی جهت توزیع صوت در نظر گرفته بودند حالت خاصی از این توزیع کلی است. با توجه به نمایش مخلوط میانگین و واریانس این توزیع و دیگر خصوصیات آن، نشان داده می شود که می توان از فیلترهای خانواده garch جهت تجزیه متغیر دارای توزیع gh به حالت مخلوط شده استفاده کرد. با استفاده از تحلیل بر اساس خود کوواریانس که معادل تحلیل طیفی است و نتایج حاصل از تجزیه egarch بر توزیع gh تابعی هموار خواهیم ساخت که تحلیل نهایی بر اساس آن انجام می پذیرد. در آخر برای رسیدن به هدف تعیین درست مناطق صوتی، بر اساس مدل egarch-gh تحلیل فعال بودن صوت را انجام داده و آن را با کارهای قبلی مقایسه نمودیم بطوریکه برتری قابل توجهی نسبت به کارهای قبلی از خود نشان داده است.