انتخاب ویژگی¬های صوتی جهت افزایش کارایی تشخیص گوینده در سیستم¬های مستقل از متن مجموعه بسته بر پایه همجوشی مدل¬ها

پایان نامه
چکیده

یکی از تکنیک¬های شناسایی هویت مبتنی بر زیست سنجی که به عنوان یک روش مناسب مورد توجه محققان بوده است، روش مبتنی بر استفاده از گفتار است. سیگنال گفتار حاوی چندین سطح اطلاعاتی است. در سطح نخست حاوی اطلاعات گفتاری شامل واژه ها و پیغام های بیان شده است. ولی در سطح دوم حاوی اطلاعات مربوط به خصوصیات گوینده گفتار شامل ویژگیهای مجرای گفتاری، احساسات و ... است. با توجه به هزینه کم و سهولت انتقال صوت از طریق تلفن، امروزه استفاده از آن در تشخیص هویت افراد مورد توجه قرار گرفته است. به طور کلی سیگنال گفتار شامل دو بخش کلی مفهوم گفتار و هویت گوینده است. زمینه شناخت گوینده مربوط به تکنیک¬هایی برای استخراج مشخصات گوینده از روی سیگنال است .در مغز انسان به راحتی گوینده¬های آشنا از یکدیگر تفکیک و تشخیص داده می¬شوند، ولیکن آنچه که برای تشخیص گوینده در سیستم¬های مصنوعی لازم است، شناخت و استخراج مشخصات گوینده از روی سیگنال گفتار آن¬ها است. هر شخصی یک الگوی صدای منحصر به فرد دارد که او را از دیگران متمایز می سازد. در صورتی که دو شخص صداهای مشابه داشته باشند، شباهت معمولاً ظاهری است و از طریق آنالیز الگوهای صدا، تمایز بین آن¬ها با یک درجه بالایی از دقت امکانپذیر است. با ظهور کامپیوترهای رقومی، آنالیز مشخصات مختلف صدای شخص با استفاده از روش¬هایی امکان پذیر شده است. الگوریتم¬های پردازش سیگنال رقومی قدرتمند برای جداسازی مشخصات ویژه یک الگوی صدا و مقایسه این الگوها با یک نسخه ذخیره شده جهت پی بردن به این که شخص صحبت کننده چه کسی است در دسترس هستند. با این الگوریتم¬ها، شناسایی صحیح یک شخص در صورتی که گفتار او توسط عواملی چون نویز محیطی، نویز حاصل از انتقال گفتار بر روی کانال¬های مخابراتی و مانند آن مخدوش نشده باشد، با یک احتمال خطای کوچک قابل قبول امکان پذیر است . به منظور افزایش دقت سیستم¬های بازشناسی گفتار و گوینده تلاش¬های بسیاری انجام شده است. که در گروهی از آن¬ها سعی شده، مستقیمأ از گفتار ویژگی¬های کاراتری استخراج شوند. در دسته ای دیگر تلاش شده تا از میان ویژگی¬های استخراج شده، ویژگی¬های موثرتری که حاوی اطلاعاتِ مربوط به گوینده بیشتری هستند، انتخاب شوند.

منابع مشابه

افزایش کارایی و پویایی در سیستم های هوشمند تشخیص گوینده مستقل از متن

سیستم تشخیص گوینده یکی دیگر از سیستم های امنیتی و کنترل تلفنی از راه دور است ، که در سال های اخیر مورد توجه قرار گرفته است. در این پایان نامه به بررسی رویکردی برای افزایش کارایی سیستم های تشخیص گوینده می پردازیم. یک روش انتخاب ویژگی برای بهبود کارایی این سیستم ها ارائه شده است. این سیستم ها از ویژگی های با ابعاد بالا استفاده می کنند، که بسیاری از این ویژگی ها اضافی و نامرتبطند. حذف ویژگی های نا...

15 صفحه اول

روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی

در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک‌تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی‌های زمان‌بلند از جمله آنتروپی عمل می‌کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت‌ها شناسایی می‌شود. با اعمال یک روش خوشه‌بندی، ویژگی‌های زمان‌کوتاه یعنی ضرایبِ ...

متن کامل

روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی

در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک‌تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی‌های زمان‌بلند از جمله آنتروپی عمل می‌کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت‌ها شناسایی می‌شود. با اعمال یک روش خوشه‌بندی، ویژگی‌های زمان‌کوتاه یعنی ضرایبِ ...

متن کامل

طبقه‌بندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن

این مقاله مسئله طبقه‌بندی شورایی را برای تصدیق گوینده مستقل از متن بررسی می‌کند. ازآنجاکه ممکن است یک طبقه‌بند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقه‌بند برای تصدیق گوینده ممکن است منجر به تصمیم قابل‌اعتمادی نشود. بنابراین بهترین سامانه‌های تصدیق گوینده از مجموعه‌ای از طبقه‌بندهای مکمل برای رسیدن به تصمیمات قابل‌اعتماد استفاده می‌کنند. در اکثر مطالعات اخیر که روی ترکیب طبقه...

متن کامل

روشی جدید در تشخیص گوینده مستقل از متن در محیط های نویزی

در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی های زمان بلند از جمله آنتروپی عمل می کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت ها شناسایی می شود. با اعمال یک روش خوشه بندی، ویژگی های زمان­کوتاه یعنی ضرایب ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023