جداسازی تک گوشی گفتار بی صدا بر پایه ی آنالیز ترکیب شنیداری
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز
- نویسنده پریا دادور
- استاد راهنما مسعود گراوانچی زاده
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
جداسازی تک گوشی گفتار از تداخل صوتی موضوع بسیار چالش انگیزی است. پژوهش های بسیاری در زمینه ی آنالیز ترکیب شنیداری محاسباتی (casa) به منظور جداسازی تک گوشی گفتار صدادار (voiced speech) از ترکیب های صوتی انجام شده است. با این وجود، جداسازی گفتار بی صدا (unvoiced speech) به عنوان یکی از چالش های مهم casa باقی مانده است. گفتار بی صدا به دلیل داشتن انرژی نسبتاً ضعیف و دارا نبودن ساختار هارمونیکی، در برابر تداخل بسیار آسیب پذیر است، که این مسأله جداسازی گفتار بی صدا را بسیار دشوار می سازد. در این پایان نامه، سیستم جدیدی به روش کاهش طیفی زیرباندی مبتنی بر نسبت سیگنال به نویز (snr-based sbss) برای جداسازی گفتار بی صدا از تداخل غیرگفتار ارائه می شود. در سیستم پیشنهادی، پس از انجام آنالیز محیطی و یک عمل پیش پردازش، برخی ویژگی های مهم سیگنال ترکیب استخراج می شوند. سپس، جداسازی گفتار بی صدا در دو مرحله صورت می گیرد: قسمت بندی و گروه بندی. در مرحله ی قسمت بندی، ابتدا گفتار صدادار و بخش های متناوب سیگنال تداخل حذف می شوند. سپس، با استفاده از ibm صدادار، فعالیت نویز در کانال های فرکانسی به )روش جدید آشکارسازی فعالیت کانالی نویز cnad) آشکار می شود و نسبت سیگنال به نویز سیگنال ورودی پیش پردازش شده تخمین زده می شود. آنگاه، انرژی نویز در هر کانال تخمین زده می شود و روش پیشنهادی snr-based sbss برای تولید قسمت های زمانی-فرکانسی در بازه های بی صدا به کار می رود. در مرحله ی بعد، قسمت های گفتار بی صدا بر اساس مشخصات فرکانسی گفتار بی صدا، با استفاده از یک روش آستانه گذاری ساده، گروه بندی می شوند. مقایسه ها و ارزیابی های اصولی با مدل hu & wang 2011 نشان می دهند که سیستم پیشنهادی، عملکرد سیستم های رایج جداسازی گفتار بی صدا را از نظر کیفیت و قابلیت فهم، به میزان قابل توجهی، بهبود می بخشد.
منابع مشابه
جداسازی تک گوشی گفتار بر اساس pitch
حضور نویز در محیط های طبیعی غیرقابل اجتناب است. استخراج گفتار مورد نظر (هدف) از نویز پس زمینه دارای حوزه کاربرد وسیعی از قبیل تشخیص خودکار گفتار، وسایل کمک شنوایی و سیستم های مخابراتی راه دور میباشد. یک شنونده انسانی توانایی قابل توجهی در جداسازی ترکیب صوتی و توجه به یک صوت هدف دارد. این فرآیند ادراکی، آنالیز ترکیب شنیداری (auditory scene analysis) نامیده میشود. هدف آنالیز ترکیب شنیداری محاسبات...
15 صفحه اولجداسازی تک گوشی گفتار بر پایهی مدل مارکوف پنهان
روش های متعددی برای تفکیک گفتارهای موجود در یک ترکیب معرفی شده اند. در بین این روش ها، پیچیده ترین آن ها روش هایی هستند که به دنبال جداسازی منابع موجود در یک سیگنال ترکیب تک گوشی (ترکیبی که در آن یک میکروفون، سیگنال ها را ذخیره می کند) می باشند. این گونه روش ها را می توان به دو دسته ی، روش های مبتنی بر ویژگی و روش های مبتنی بر مدل، تقسیم بندی کرد. روش پیاده شده در این پایان نامه، در دسته ی دوم ...
بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی
چکیده: در این مقاله، سیستمهای جدیدی بهمنظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام MESSL ارائه میشود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم EM، مدلهای گوسی پارامترهای اختلاف فاز درونگوشی (IPD) و اختلاف شدت درونگوشی (ILD) به دست میآیند. سپس، با استفاده از مدل بهدستآمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمانکوتاه (STFT) سیگنال مخلو...
متن کاملبهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی
چکیده: در این مقاله، سیستمهای جدیدی بهمنظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام messl ارائه میشود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم em، مدلهای گوسی پارامترهای اختلاف فاز درونگوشی (ipd) و اختلاف شدت درونگوشی (ild) به دست میآیند. سپس، با استفاده از مدل بهدستآمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمانکوتاه (stft) سیگنال مخلو...
متن کاملجداسازی تک گوشی گفتار صدادار مبتنی بر روش های جدید انتخاب واحدهای زمان-فرکانس در فرکانس های پایین و بالا
متن کامل
تخمین SNR ورودی با استفاده از ماسک باینری در سیستمهای مبتنی بر آنالیز ترکیب شنیداری محاسباتی
در این مقاله، روش جدیدی برای تخمین نسبت سیگنال به نویز (SNR) سیگنال ترکیب ارائه شده است که بر پایه روش آنالیز ترکیب شنیداری محاسباتی (CASA) است. در روش ارائهشده، ماسک باینری ایدهآل (IBM) که به طور معمول هدف محاسباتی سیستمهای مبتنی بر CASA است، برای تخمین SNR سیگنال گفتار نویزی به کار گرفته میشود. روش پیشنهادی با استفاده از IBM و چندین ماسک شبه IBM ارزیابی شده است. این روش، ساده و از نظر محا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023