جداسازی تک گوشی گفتار بی صدا بر پایه ی آنالیز ترکیب شنیداری

پایان نامه
چکیده

جداسازی تک گوشی گفتار از تداخل صوتی موضوع بسیار چالش انگیزی است. پژوهش های بسیاری در زمینه ی آنالیز ترکیب شنیداری محاسباتی (casa) به منظور جداسازی تک گوشی گفتار صدادار (voiced speech) از ترکیب های صوتی انجام شده است. با این وجود، جداسازی گفتار بی صدا (unvoiced speech) به عنوان یکی از چالش های مهم casa باقی مانده است. گفتار بی صدا به دلیل داشتن انرژی نسبتاً ضعیف و دارا نبودن ساختار هارمونیکی، در برابر تداخل بسیار آسیب پذیر است، که این مسأله جداسازی گفتار بی صدا را بسیار دشوار می سازد. در این پایان نامه، سیستم جدیدی به روش کاهش طیفی زیرباندی مبتنی بر نسبت سیگنال به نویز (snr-based sbss) برای جداسازی گفتار بی صدا از تداخل غیرگفتار ارائه می شود. در سیستم پیشنهادی، پس از انجام آنالیز محیطی و یک عمل پیش پردازش، برخی ویژگی های مهم سیگنال ترکیب استخراج می شوند. سپس، جداسازی گفتار بی صدا در دو مرحله صورت می گیرد: قسمت بندی و گروه بندی. در مرحله ی قسمت بندی، ابتدا گفتار صدادار و بخش های متناوب سیگنال تداخل حذف می شوند. سپس، با استفاده از ibm صدادار، فعالیت نویز در کانال های فرکانسی به )روش جدید آشکارسازی فعالیت کانالی نویز cnad) آشکار می شود و نسبت سیگنال به نویز سیگنال ورودی پیش پردازش شده تخمین زده می شود. آنگاه، انرژی نویز در هر کانال تخمین زده می شود و روش پیشنهادی snr-based sbss برای تولید قسمت های زمانی-فرکانسی در بازه های بی صدا به کار می رود. در مرحله ی بعد، قسمت های گفتار بی صدا بر اساس مشخصات فرکانسی گفتار بی صدا، با استفاده از یک روش آستانه گذاری ساده، گروه بندی می شوند. مقایسه ها و ارزیابی های اصولی با مدل hu & wang 2011 نشان می دهند که سیستم پیشنهادی، عملکرد سیستم های رایج جداسازی گفتار بی صدا را از نظر کیفیت و قابلیت فهم، به میزان قابل توجهی، بهبود می بخشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

جداسازی تک گوشی گفتار بر اساس pitch

حضور نویز در محیط های طبیعی غیرقابل اجتناب است. استخراج گفتار مورد نظر (هدف) از نویز پس زمینه دارای حوزه کاربرد وسیعی از قبیل تشخیص خودکار گفتار، وسایل کمک شنوایی و سیستم های مخابراتی راه دور میباشد. یک شنونده انسانی توانایی قابل توجهی در جداسازی ترکیب صوتی و توجه به یک صوت هدف دارد. این فرآیند ادراکی، آنالیز ترکیب شنیداری (auditory scene analysis) نامیده میشود. هدف آنالیز ترکیب شنیداری محاسبات...

15 صفحه اول

جداسازی تک گوشی گفتار بر پایهی مدل مارکوف پنهان

روش های متعددی برای تفکیک گفتارهای موجود در یک ترکیب معرفی شده اند. در بین این روش ها، پیچیده ترین آن ها روش هایی هستند که به دنبال جداسازی منابع موجود در یک سیگنال ترکیب تک گوشی (ترکیبی که در آن یک میکروفون، سیگنال ها را ذخیره می کند) می باشند. این گونه روش ها را می توان به دو دسته ی، روش های مبتنی بر ویژگی و روش های مبتنی بر مدل، تقسیم بندی کرد. روش پیاده شده در این پایان نامه، در دسته ی دوم ...

بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی

چکیده: در این مقاله، سیستم­های جدیدی به­منظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام MESSL ارائه می­شود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم EM، مدل­های گوسی پارامترهای اختلاف فاز درون­گوشی (IPD) و اختلاف شدت درون­گوشی (ILD) به ­دست می­آیند. سپس، با استفاده از مدل به­دست­آمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمان­کوتاه (STFT) سیگنال مخلو...

متن کامل

بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی

چکیده: در این مقاله، سیستم­های جدیدی به­منظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام messl ارائه می­شود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم em، مدل­های گوسی پارامترهای اختلاف فاز درون­گوشی (ipd) و اختلاف شدت درون­گوشی (ild) به ­دست می­آیند. سپس، با استفاده از مدل به­دست­آمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمان­کوتاه (stft) سیگنال مخلو...

متن کامل

تخمین SNR ورودی با استفاده از ماسک باینری در سیستم‌های مبتنی بر آنالیز ترکیب شنیداری محاسباتی

در این مقاله، روش جدیدی برای تخمین نسبت سیگنال به نویز (SNR) سیگنال ترکیب ارائه شده است که بر پایه روش آنالیز ترکیب شنیداری محاسباتی (CASA) است. در روش ارائه‌شده، ماسک باینری ایده‌آل (IBM) که به طور معمول هدف محاسباتی سیستم‌های مبتنی بر CASA است، برای تخمین SNR سیگنال گفتار نویزی به کار گرفته می‌شود. روش پیشنهادی با استفاده از IBM و چندین ماسک شبه IBM ارزیابی شده است. این روش، ساده و از نظر محا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023