بازشناسی گوینده وابسته به متن
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
- نویسنده عزیزه راستگار
- استاد راهنما فرشاد الماس گنج
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1386
چکیده
دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج مشخصه از لغات صحبت شده و سپس طبقه بندی آنها بصورت وابسته به یک شخص است. هدف از اجرای این پروژه، بکارگیری سیستمی است که قادر به شناسایی یک شخص از نمونه گفتارش باشد. نتایج حاصل از این کار برای سیستم های وابسته به متن و مستقل از متن صادق می باشد. مشخصات بکارگرفته شده توسط این سیستم که دو نمونه گفتار را مقایسه می کند عبارتند از : تخمین pitch، اطلاعات طیفی (ضرائب ویولت) و ضرائب مل کپستروم. این مشخصات جهت ایجاد خصوصیات گفتار به کار می روند که در یک پایگاه داده ذخیره می گردند. در مرحله بعدی از یک نمونه گفتار تست با استفاده از الگوریتم های مذکور ویژگیها استخراج گردیده و با ویژگیهای گفتار ذخیره شده در پایگاه داده توسط شبکه عصبی مقایسه می شود و نتایج حاصله که حاکی از شخص شناسایی شده می باشد بدست می آید. در روش وابسته به متن انجام گرفته در این پروژه، یک گروه 30نفری از مرد وزن مورد آزمایش قرار گرفتند و برای روش مستقل از متن، از 50 گوینده دادگان فارس دات استفاده گردید. نتایج حاصل از بازشناسی، برای روش اول 100 درصد صحت بازشناسی و برای روش دوم 4 درصد خطا را نشان می دهند که در مقایسه با روش mfcc تقریبا 4 درصد بهبود حاصل گردیده است. برای افزایش درصد بازشناسی می توان از ترکیب ویژگیهای استخراج شده استفاده نمود. همچنین در این پروژه استفاده از ویژگیهای prosody باعث کاهش خطا در بازشناسی در حدود 10 درصد شده است.
منابع مشابه
مدلسازی وابسته به متن در بازشناسی گفتار پیوسته بر اساس در خت تصمیم گیری آوایی فارسی
مدلسازی وابسته به متن به عنوان شیوه ای مفید برای افزایش دقت مدلسازی در بازشناسی گفتار پیوسته مورد توجه است. معمولترین شکل پیاده سازی این شیوه، استفاده از مدلهای سه آوایی است. با این همه، تعداد زیاد این مدلها موجب می شود که در عمل، آموزش سیستم با مشکلات زیادی همراه باشد و دستیابی به آموزش مقاوم (robust training) به سختی میسر گشته یا اصولا مقدور نشود. یکی از شیوه های حل این مشکل، استفاده از روش گ...
متن کاملرتبهبندی واجهای گفتار فارسی از نظر کارآیی در بازشناسی گوینده
در این مقاله، کارآیی واجهای گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآییها، رتبهبندی واجها صورت گرفتهاند. جهت برآورد کارآیی واجها، از یک معیاری که بهصورت نسب « فاصلة بینگویندهای» واجها به « فاصلة در گویندهای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیدهایم، استفاده شده است. آزمایشها و محاسبات لازم برای کلیه واجهای گفتار...
متن کاملطبقهبندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن
این مقاله مسئله طبقهبندی شورایی را برای تصدیق گوینده مستقل از متن بررسی میکند. ازآنجاکه ممکن است یک طبقهبند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقهبند برای تصدیق گوینده ممکن است منجر به تصمیم قابلاعتمادی نشود. بنابراین بهترین سامانههای تصدیق گوینده از مجموعهای از طبقهبندهای مکمل برای رسیدن به تصمیمات قابلاعتماد استفاده میکنند. در اکثر مطالعات اخیر که روی ترکیب طبقه...
متن کاملبازشناسی گوینده مستقل از متن براساس گفتار تلفنی توسط شبکه های عصبی
در این پایان نامه سیستمی به منظور بازشناسی هویت گوینده مستقل از متن براساس گفتار تلفنی و به کمک شبکه های عصبی طراحی و پیاده سازی شده است . جهت این کار از دو دادگان گفتار زبان فارسی farsdat و tfarsdat استفاده شده است .
15 صفحه اولطبقه بندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن
این مقاله مسئله طبقه بندی شورایی را برای تصدیق گوینده مستقل از متن بررسی می کند. ازآنجاکه ممکن است یک طبقه بند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقه بند برای تصدیق گوینده ممکن است منجر به تصمیم قابل اعتمادی نشود. بنابراین بهترین سامانه های تصدیق گوینده از مجموعه ای از طبقه بندهای مکمل برای رسیدن به تصمیمات قابل اعتماد استفاده می کنند. در اکثر مطالعات اخیر که روی ترکیب طبقه...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023