پریا دادور

نام پژوهشگر: پریا دادور

جداسازی تک گوشی گفتار بی صدا بر پایه ی آنالیز ترکیب شنیداری

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز 1390
پریا دادور مسعود گراوانچی زاده

جداسازی تک گوشی گفتار از تداخل صوتی موضوع بسیار چالش انگیزی است. پژوهش های بسیاری در زمینه ی آنالیز ترکیب شنیداری محاسباتی (casa) به منظور جداسازی تک گوشی گفتار صدادار (voiced speech) از ترکیب های صوتی انجام شده است. با این وجود، جداسازی گفتار بی صدا (unvoiced speech) به عنوان یکی از چالش های مهم casa باقی مانده است. گفتار بی صدا به دلیل داشتن انرژی نسبتاً ضعیف و دارا نبودن ساختار هارمونیکی، در برابر تداخل بسیار آسیب پذیر است، که این مسأله جداسازی گفتار بی صدا را بسیار دشوار می سازد. در این پایان نامه، سیستم جدیدی به روش کاهش طیفی زیرباندی مبتنی بر نسبت سیگنال به نویز (snr-based sbss) برای جداسازی گفتار بی صدا از تداخل غیرگفتار ارائه می شود. در سیستم پیشنهادی، پس از انجام آنالیز محیطی و یک عمل پیش پردازش، برخی ویژگی های مهم سیگنال ترکیب استخراج می شوند. سپس، جداسازی گفتار بی صدا در دو مرحله صورت می گیرد: قسمت بندی و گروه بندی. در مرحله ی قسمت بندی، ابتدا گفتار صدادار و بخش های متناوب سیگنال تداخل حذف می شوند. سپس، با استفاده از ibm صدادار، فعالیت نویز در کانال های فرکانسی به )روش جدید آشکارسازی فعالیت کانالی نویز cnad) آشکار می شود و نسبت سیگنال به نویز سیگنال ورودی پیش پردازش شده تخمین زده می شود. آنگاه، انرژی نویز در هر کانال تخمین زده می شود و روش پیشنهادی snr-based sbss برای تولید قسمت های زمانی-فرکانسی در بازه های بی صدا به کار می رود. در مرحله ی بعد، قسمت های گفتار بی صدا بر اساس مشخصات فرکانسی گفتار بی صدا، با استفاده از یک روش آستانه گذاری ساده، گروه بندی می شوند. مقایسه ها و ارزیابی های اصولی با مدل hu & wang 2011 نشان می دهند که سیستم پیشنهادی، عملکرد سیستم های رایج جداسازی گفتار بی صدا را از نظر کیفیت و قابلیت فهم، به میزان قابل توجهی، بهبود می بخشد.

۱۵ صفحه ی اول