نام پژوهشگر: امید سجادی

بهبود روش های متمایزسازی گفتار-موسیقی با استفاده از آنالیز تفکیک خطی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق 1387
  امید سجادی   محمد احدی

در تحقیقات کنونی برای پردازش و تحلیل محتوای سیگنال های صوتی، طبقه بندی و قطعه بندی صوت به مسئله مهمی تبدیل شده است. متمایزسازی گفتار-موسیقی بعنوان دو کلاس مهم از سیگنال های صوتی یکی از مهم ترین شاخه ها در این زمینه است که کاربردهای بسیاری از جمله بعنوان پیش پردازش سیستم های بازشناسی گفتار خودکار، شاخص گذاری و بازیابی بر اساس محتوای صوت و تصویر، بهبود کدینگ صوت و مدیریت آرشیوهای صوتی دارد. بنابراین در سال های اخیر که با رشد نمایی اینترنت و رسانه های جمعی و همچنین پیشرفت های بدست آمده در تکنولوژی شبکه و فشرده سازی، حجم عظیمی از اطلاعات صوتی در اختیار قرار گرفته است، افراد زیادی روش های مختلفی جهت طبقه بندی و قطعه بندی گفتار-موسیقی ارائه کرده اند. در این پایان نامه، ما ابتدا ویژگی هایی که قابلیت متمایزسازی گفتار-موسیقی را دارند، توصیف و استخراج می کنیم. سپس برای قطعه بندی، یک روش بدون نظارت با الهام از جستجوی پنجره ای و برپایه نرخ خطای آموزش ماشین های بردار پشتیبان معرفی و آن را با روش های متداول قطعه بندی صوت مقایسه می نماییم. همچنین برای طبقه بندی گفتار-موسیقی، یک روش بدون نظارت با الهام از الگوریتم خوشه بندی k-means و با استفاده از ماشین های بردار پشتیبان تک کلاسی ارائه و آن را با کارهای پیشین مقایسه می کنیم. در پایان تأثیر آنالیز مولفه های اساسی، آنالیز تفکیک خطی و یک روش نگاشت ویژگی غیرپارامتری را بر الگوریتم های طبقه بندی متداول با نظارت مانند ماشین های بردار پشتیبان، k نزدیکترین همسایگی و مدل های مخلوط گوسی بررسی می کنیم. آزمایش های انجام شده، نتایج امیدوار کننده ای را نشان می دهد.