انتخاب ویژگی¬های صوتی جهت افزایش کارایی تشخیص گوینده در سیستم¬های مستقل از متن مجموعه بسته بر پایه همجوشی مدل¬ها
پایان نامه
- دانشگاه تربیت معلم - تهران - دانشکده فنی
- نویسنده عباس وحدت آزاد
- استاد راهنما منوچهر کلارستاقی فرهاد عشقی
- سال انتشار 1392
چکیده
یکی از تکنیک¬های شناسایی هویت مبتنی بر زیست سنجی که به عنوان یک روش مناسب مورد توجه محققان بوده است، روش مبتنی بر استفاده از گفتار است. سیگنال گفتار حاوی چندین سطح اطلاعاتی است. در سطح نخست حاوی اطلاعات گفتاری شامل واژه ها و پیغام های بیان شده است. ولی در سطح دوم حاوی اطلاعات مربوط به خصوصیات گوینده گفتار شامل ویژگیهای مجرای گفتاری، احساسات و ... است. با توجه به هزینه کم و سهولت انتقال صوت از طریق تلفن، امروزه استفاده از آن در تشخیص هویت افراد مورد توجه قرار گرفته است. به طور کلی سیگنال گفتار شامل دو بخش کلی مفهوم گفتار و هویت گوینده است. زمینه شناخت گوینده مربوط به تکنیک¬هایی برای استخراج مشخصات گوینده از روی سیگنال است .در مغز انسان به راحتی گوینده¬های آشنا از یکدیگر تفکیک و تشخیص داده می¬شوند، ولیکن آنچه که برای تشخیص گوینده در سیستم¬های مصنوعی لازم است، شناخت و استخراج مشخصات گوینده از روی سیگنال گفتار آن¬ها است. هر شخصی یک الگوی صدای منحصر به فرد دارد که او را از دیگران متمایز می سازد. در صورتی که دو شخص صداهای مشابه داشته باشند، شباهت معمولاً ظاهری است و از طریق آنالیز الگوهای صدا، تمایز بین آن¬ها با یک درجه بالایی از دقت امکانپذیر است. با ظهور کامپیوترهای رقومی، آنالیز مشخصات مختلف صدای شخص با استفاده از روش¬هایی امکان پذیر شده است. الگوریتم¬های پردازش سیگنال رقومی قدرتمند برای جداسازی مشخصات ویژه یک الگوی صدا و مقایسه این الگوها با یک نسخه ذخیره شده جهت پی بردن به این که شخص صحبت کننده چه کسی است در دسترس هستند. با این الگوریتم¬ها، شناسایی صحیح یک شخص در صورتی که گفتار او توسط عواملی چون نویز محیطی، نویز حاصل از انتقال گفتار بر روی کانال¬های مخابراتی و مانند آن مخدوش نشده باشد، با یک احتمال خطای کوچک قابل قبول امکان پذیر است . به منظور افزایش دقت سیستم¬های بازشناسی گفتار و گوینده تلاش¬های بسیاری انجام شده است. که در گروهی از آن¬ها سعی شده، مستقیمأ از گفتار ویژگی¬های کاراتری استخراج شوند. در دسته ای دیگر تلاش شده تا از میان ویژگی¬های استخراج شده، ویژگی¬های موثرتری که حاوی اطلاعاتِ مربوط به گوینده بیشتری هستند، انتخاب شوند.
منابع مشابه
افزایش کارایی و پویایی در سیستم های هوشمند تشخیص گوینده مستقل از متن
سیستم تشخیص گوینده یکی دیگر از سیستم های امنیتی و کنترل تلفنی از راه دور است ، که در سال های اخیر مورد توجه قرار گرفته است. در این پایان نامه به بررسی رویکردی برای افزایش کارایی سیستم های تشخیص گوینده می پردازیم. یک روش انتخاب ویژگی برای بهبود کارایی این سیستم ها ارائه شده است. این سیستم ها از ویژگی های با ابعاد بالا استفاده می کنند، که بسیاری از این ویژگی ها اضافی و نامرتبطند. حذف ویژگی های نا...
15 صفحه اولروشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی
در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچکتر شامل چند آوا و حداقل یک واکه برای استخراج ویژگیهای زمانبلند از جمله آنتروپی عمل میکند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنتها شناسایی میشود. با اعمال یک روش خوشهبندی، ویژگیهای زمانکوتاه یعنی ضرایبِ ...
متن کاملروشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی
در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچکتر شامل چند آوا و حداقل یک واکه برای استخراج ویژگیهای زمانبلند از جمله آنتروپی عمل میکند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنتها شناسایی میشود. با اعمال یک روش خوشهبندی، ویژگیهای زمانکوتاه یعنی ضرایبِ ...
متن کاملطبقهبندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن
این مقاله مسئله طبقهبندی شورایی را برای تصدیق گوینده مستقل از متن بررسی میکند. ازآنجاکه ممکن است یک طبقهبند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقهبند برای تصدیق گوینده ممکن است منجر به تصمیم قابلاعتمادی نشود. بنابراین بهترین سامانههای تصدیق گوینده از مجموعهای از طبقهبندهای مکمل برای رسیدن به تصمیمات قابلاعتماد استفاده میکنند. در اکثر مطالعات اخیر که روی ترکیب طبقه...
متن کاملروشی جدید در تشخیص گوینده مستقل از متن در محیط های نویزی
در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی های زمان بلند از جمله آنتروپی عمل می کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت ها شناسایی می شود. با اعمال یک روش خوشه بندی، ویژگی های زمانکوتاه یعنی ضرایب ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
دانشگاه تربیت معلم - تهران - دانشکده فنی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023