نام پژوهشگر: سارا محمودان

دسته بندی خودکار نشانه های صوتی با استفاده از شبکه عصبی مصنوعی
پایان نامه سایر - دانشکده صدا و سیمای جمهوری اسلامی ایران 1390
  سارا محمودان   ایوب بَنوشی

دسته بندی یکی از شیوه های سازمان دهیِ اطلاعات برای بازیابی سریع آن هاست. لزوم دسته بندی نشانه های صوتی بر اساس محتوا در سازماندهی و مدیریت منابع در آرشیوهای رادیو و تلویزیون و اینترنت امری بدیهی است. از آن جا که طبقه بندیِ دستی، کاری وقت گیر و پرهزینه است، دسته بندی خودکار در این فرایند می تواند روشی ارزشمند برای سیستم های بازیابی اطلاعات و سازماندهی فایلهای صوتی بر اساس محتوا باشد. با گسترش صدای دیجیتال در سالهای اخیر، کاربرد فناوری تشخیص الگو در صدای دیجیتال رشد روز افزون یافته است. روش های مختلفی از جمله شبکه عصبی، برای دسته بندی خودکار مورد استفاده قرار می گیرد. با دادن ورودی های تکراری در گروه های دسته بندی شده به آن، این شبکه تشخیص معیارهای دسته بندی را می آموزد. و به این ترتیب می تواند ورودی های جدیدی را که در طی آموزش استفاده نکرده است ، دسته بندی کند. در این پژوهش، روشی برای دسته بندی دستگاه های موسیقی با استفاده از شبکه عصبیِ مصنوعی با توابعِ پایهِ شعاعی پیشنهاد می شود. دراین فرآیند شش دستگاه و یا آواز موسیقی ایرانی شامل (ماهور دو، بیات ترک دو، بیات اصفهان دو، چهارگاه دو، سه گاه می کرن و شور سل) مورد بررسی قرار می گیرند. برنامه با گرفتن تبدیل فوریه از قطعات ضبط شده، فرکانس های غالب را استخراج می کند و به عنوان الگوی ورودی به شبکه عصبی می دهد. در این روش از 135 داده برای آموزش و 60 داده برای آزمون شبکه استفاده می شود. و در نهایت سیستم باید دستگاه ماهور را از سایر دستگاه ها تمیز دهد. دقت طبقه بندی دستگاه ها در دو مجموعه ماهور و غیر ماهور به ترتیب 33/73% و 86% می باشد.