نام پژوهشگر: امیر ضیاالدینی
امیر ضیاالدینی بهزاد نظری
امروزه توسعه ی فن آوری اطلاعات و حجم روزافزون داده ها، منجربه بروز نیازهای جدیدی در زمینه ی جستجوی داده شده است. در این راستا تحقیقات بسیاری در زمینه ی جستجوی داده های صوتی نیز صورت گرفته که از این میان، بازیابی اطلاعات موسیقی، موضوعی است که کاربرد آن در آینده بیشتر و بیشتر خواهد شد. در حالی که بازیابی قطعات موسیقی بر اساس اطلاعاتی از قبیل عنوان، آهنگساز و ژانر در بسیاری از سیستم های موجود انجام می گیرد، ظهور موسیقی دیجیتال در اینترنت، موجبات نیاز به روش های جدید جستجوی این گونه داده ها را بر اساس محتوای موسیقاییشان فراهم آورده است. در این پژوهش، مجموعه روش ها و سیستم هایی با عنوان " جستجو توسط زمزمه کردن " (qbh) و تحقیقات گذشته در این راستا که می توانند بر پایه ی زمزمه کردن یا سوت زدن مدت زمان کوتاهی از یک قطعه ی خاص، آن را در یک پایگاه داده ی موسیقی بیابند، معرفی شده اند. ازآنجا که ملودی زمزمه شده ممکن است به علت عدم درست خوانده شدن، خطاهای بسیاری داشته باشد، این سیستم باید توانایی تحمل خطا را نیز داشته باشد. بعلاوه، استخراج ملودی و نمایش آن، یافتن قرکانس گام، هم ترازی سری های زمانی حاصل از پردازش ملودی ها، اجرای الگوریتم های تطبیق دهی دنباله ها و کاهش زمان اجرا برای یک سیستم qbh قوی وکارآمد، الزامی می باشند. در این پژوهش با بررسی قطعات موسیقی و بررسی نحوه ی یادآوری قطعات موسیقی در ذهن افراد مختلف، برخلاف برخی از روش های موجود از فرکانس مطلق نت ها برای نمایش ملودی ها استفاده نمی شود، بلکه از آنجایی که این افراد ممکن است قطعات موسیقی را در کلیدها یا اکتاوهای متنوع موسیقایی بخوانند، از فرکانس نسبی نت های خوانده شده توسط آنها برای نمایش ملودی ها استفاده می شود. عنصر ریتم نیز از طریق معیاری به نام ioiratio در نظر گرفته می شود. این معیار در برابر سرعت مقاوم می باشد تا کاربر بتواند حتی با سرعتی بیشتر یا کمتر از سرعت واقعی قطعه ی مورد نظرش، آن را زمزمه کند و مشکل خاصی در بازیابی قطعه ی مورد نظر پیش نیاید. همچنین در این پژوهش روش انحراف پویای زمان (dtw) که بر پایه ی برنامه ریزی پویا (dynamic programming) استوار می باشد، برایتطبیق دهی جستار و قطعات موسیقی پایگاه داده و سنجیدن میزان شباهت آنها مورد استفاده قرار گرفته است و در ادامه با اعمالمحدودیت های سراسری ایتاکورا و سائوکو-چیبا سعی در بهبود میزان دقت بازیابی و سرعت اجرای آن شده است. سپس با معرفی الگوریتم sdtw کهبه صورت آماری با دنباله های فرکانسی فوق رفتار می کند و هر نمونه ی فرکانسی را به فرم توزیعی گوسی حول آن نمونه در نظر می گیرد، میزان دقت بازیابی بهبود داده شده است. اطلاعات بدنه ای 3، 5 و 7 سطحی و همچنین استفاده از فواصل دیگری مانندlb_keogh، lb_dr و lb_paa نیز بدین منظور مورد بررسی قرار گرفته اند. همچنین به منظور کاهش هزینه ی محاسباتی و زمانی، از روش های کاهش بعد نظیر ftw، pdtw و iddtw استفاده شده است. با اعمال این روش ها یک مصالحه میان دقت بازیابی سیستم و زمان اجرای آن به وجود می آید و در این بین iddtw عملکرد بهتری دارد. در این روش ها عمدتا از ضرایب تقریب تجمعی تکه ای برای نمایش کاهش بعد یافته ی جستار و قطعات پایگاه داده به همراه الگوریتم dtw استفاده می شود. از یک معیار به نام mrr نیز برای تعیین میزان دقت بازیابی جستارها استفاده می شود.