نام پژوهشگر: سعیده فولادگر

طراحی و ارزیابی یک معیار کمی برای تعیین کیفیت ویدئو
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1393
  سعیده فولادگر   عبدالرسول قاسمی

ظهور تکنولوژی اینترنت و موبایل، افزایش علاقه به سرویس های چند رسانه ای در شبکه های سیمی و بی سیم و نیز در دسترس قرار گرفتن حجم وسیعی از تصاویر و ویدئوهای کدشده و فشرده شده، ارزیابی کیفیت تصویر و ویدئو را به یک چالش تبدیل کرده است. با توجه به اینکه گیرنده نهایی در کاربردهای مختلف تصاویر و ویدئوها انسان ها هستند، نظرات بینندگان در مورد کیفیت ویدئو بسیار حائز اهمیت است. ارزیابی کیفیت ویدئو از مسائل اساسی در بهبود نظارت و کنترل، بهبود روش های پردازش تصویر و ویدئو، پنهان سازی خطا و بسیاری از کاربردهای دیگر است. ارزیابی کیفیت ویدئو به صورت ذهنی با مشکلات زیادی از جمله زمانبر بودن و پر هزینه بودن و در برخی مواقع ناممکن بودن همراه است. به همین دلیل در سالهای اخیر توسعه روش های ارزیابی عینی کیفیت ویدئو بیش از پیش مورد توجه قرار گرفته است. محققان، ارزیابی کیفیت تصویر و ویدئو را در سه حوزه ی مرجع کامل، مرجع کاهش یافته و بدون مرجع انجام می دهند. در این پایان نامه یک روش جدید ارزیابی کیفیت ویدئو در حوزه مرجع کاهش یافته ارائه شده است، که از اختلاف آنتروپی های زمانی و مکانی و نیز مقایسه پارامترهای آماری صحنه های طبیعی استفاده می کند. در این روش ترکیبی از مدل های آماری و اصول ادراکی، برای طراحی الگوریتم های ارزیابی کیفیت ویدئو استفاده شده است. مدل ترکیب مقیاس گوسی و مدل توزیع گوسی تعمیم یافته، برای ضرایب موجک قابها و تفاوت های قاب به ترتیب برای اندازه گیری اطلاعات متفاوت مکانی و زمانی بین قابها مورد استفاده قرار گرفته است. سپس تفاوت اطلاعات زمانی و مکانی به یک شبکه عصبی سه لایه با یک لایه میانی برای آموزش ارسال می شود. این شبکه تفاوت اطلاعات زمانی و مکانی را به عنوان ورودی دریافت می کند و با توجه به تابع هدف که شامل نمرات ذهنی موجود در پایگاه داده ی ارزیابی کیفیت ویدئو است، وزن های شبکه را تنظیم می کند. برای ارزیابی بهینه بودن الگوریتم های ارزیابی کیفیت تصویر و ویدئو روش های مختلفی از جمله همبستگی بین داده های ذهنی و عینی وجود دارد. مقدار ضریب همبستگی اسپیرمن(srocc) نمرات پیش بینی شده توسط شبکه عصبی برابر 8276/0 است که در مقایسه با الگوریتم strred از دسته روش های مرجع کاهش یافته کهsrocc برابر8007/0 و movie از دسته روش های مرجع کامل که srocc برابر 8059/0 دارد، بهبود قابل توجهی داشته است. همچنین اطلاعات مکانی و زمانی استخراج شده از ویدئوها به یک شبکه rbf داده شده است تا با روش رده بندی k-means با 36 گره میانی، ویدئوها بر اساس کیفیت، دسته بندی شوند. برای تست رده بندی، میانگین نمرات انسانی داده های اطراف یک گره میانی، به عنوان نمره کیفیت آن دسته معرفی شده است و سپس srocc و ضریب همبستگی پیرسون (pcc) بین نمرات پایگاه داده و داده های تست رده بندی شده، محاسبه می شود که به ترتیب برابر8103/0 و 8199/0 است و نشان دهنده دسته بندی مناسب ویدئوها بر اساس کیفیت آن ها است. الگوریتم مورد ارزیابی در این پایان نامه همبستگی بالایی با نمرات انسانی داشته است که نشان دهنده بهبود الگوریتم است.