نام پژوهشگر: فرزانه عزیزخانی

تشخیص خودکار سیگنالهای موسیقی و گفتار فارسی
thesis سایر - دانشکده صدا و سیمای جمهوری اسلامی ایران 1392
  فرزانه عزیزخانی   محمد بهدادفر

با توجه به رشد روز افزون محتوای چند رسانه¬ای، زمینه¬های تحقیقاتی جدیدی همچون تحلیل محتوای صوتی جهت پردازش، تشخیص و دسته¬بندی داده¬ها بر اساس محتوا معرفی شده است. مسئله دسته¬بندی سیگنال هایِ گفتار و موسیقی که زیر مجموعه¬ای از این تحقیقاتِ جدید است، توسط محققان زیادی مورد توجه و بررسی قرار گرفته است. با این وجود، تاکنون الگوریتمی که بتواند در لحظه همانند سیستمِ شنوایی انسان عمل کرده و سیگنال¬های صوتی دریافتی را با دقتی برابر دقت سیستم شنوایی طبقه¬بندی نماید ارائه نشده است. هر تحقیق جدیدی در این زمینه یا ویژگی¬های جدیدی را معرفی می¬کند یا ویژگی¬هایی که در مقالات قبلی از آنها استفاده شده را بهبود می¬بخشد. در این پایان¬¬نامه نیز سعی شده است که از مجموعه ویژگیهایی همچون درصد فریم¬های انرژی پایین وانحراف معیار شار طیفی که در تحقیقات انجام شده توانایی مناسبی در تفکیک از خود نشان داده اند، استفاده شود. همچنین، دو ویژگی رویداد عبور نکردن سیگنال مثبت از صفر و عبور نکردن سیگنال منفی از صفر در این پایان¬نامه مورد بررسی قرار گرفته¬اند که بر اساس یافته¬های ما، تاکنون در تحقیقات داخل کشور برای تشخیص گفتار فارسی از موسیقی مورد بررسی قرار نگرفته¬اند. بر این اساس، چهار ویژگی فوق از نمونه¬های صوتی با عرض 20 میلی¬ثانیه از گفتار فارسی و موسیقی استخراج و جهت آموزش و آزمایش درستی تشخیص سیگنال گفتار و موسیقی به دو نوع شبکه¬ عصبیmlp و rbf و یک روش آماری k-nn ارائه شده است. نتایج این الگوریتمها بر اساس ویژگی¬های به کار رفته مورد ارزیابی و مقایسه قرار گرفته است.