نام پژوهشگر: عفت کریمقاسمی رابری
عفت کریمقاسمی رابری مهدی رضایی
ویدئوی دیجیتال در سال های اخیر کاربردهای زیادی پیدا کرده است. در بسیاری از این کاربردها نیاز به فشرده¬سازی و انتقال ویدئو می¬باشد. برای فشرده سازی و کد کردن ویدئو، استانداردهای زیادی وجود دارد که جدیدترین استاندارد رایجh.264/avc می باشد. فرآیند کنترل نرخ بیت، یکی از مهمترین قسمت ها در الگوریتم فشرده سازی می باشد که در استاندارد تعریف نمی شود و کاربر متناسب با نیاز خود آن را طراحی می کند. کنترل نرخ بیت تاثیر بسزایی در کارایی کل سیستم، اعم از کیفیت ویدئو، استفاده از منابع مثل پهنای باند انتقال، زمان و قدرت پردازش دارد. الگوریتم¬های کنترل نرخ بیت (rca)، عموماَ بر پایه¬ی نرخ بیت ثابت یا کوانتیزاسیون ثابت می باشند. الگوریتم هایی که بر پایه ی نرخ بیت ثابت هستند، مستلزم کیفیت متغیر و الگوریتم هایی که بر پایه ی کوانتیزاسیون ثابت هستند، مستلزم نرخ بیت متغیر می باشند. حالت های میانی نیز وجود دارد که در آن سعی می شود نرخ بیت و کیفیت، همزمان در حد امکان ثابت نگه داشته شود. این الگوریتم ها تحت عنوان الگوریتم های با نرخ بیت متغیر شناخته می شوند. الگوریتم های با نرخ بیت متغیر از نظر کیفیت دیداری عملکرد بهتری نسبت به نرخ بیت ثابت دارند. اگرچه کیفیت دیداری ویدئو بستگی به خواص سیستم بینایی انسان (hvs) دارد، در طراحی rca با نرخ بیت متغیر از ویژگی های سیستم بینایی انسان، مستقیماً استفاده نشده است. در این تحقیق، هدف، طراحی کنترل کننده ی نرخ بیت ویدئوی h.264 برای کاربردهای با نرخ بیت متغیر با استفاده از ویژگی های سیستم بینایی انسان می باشد. در راستای رسیدن به این هدف، ابتدا الگوریتمی طراحی نمودیم که از دو بخش اصلی، کنترل کننده ی نرخ بیت فازی و کنترل-کننده ی کیفیت ادراکی تشکیل شده است. کنترل کننده ی نرخ بیت فازی با در نظر گرفتن محدودیت بافر، کنترل را در سطح فریم انجام می دهد و کنترل کننده ی کیفیت ادراکی با بهره گیری از ویژگی های سیستم بینایی انسان سبب افزایش کیفیت دیداری ویدئوی کد شده می شود. در ادامه الگوریتم دیگری پیشنهاد کردیم که در آن کنترل کننده ی کیفیت ادراکی با استفاده از منطق فازی، طراحی شده است. الگوریتم های پیشنهادی در این تحقیق روی نرم افزار مرجع h.264 jm پیاده سازی شده و کارایی آنها ارزیابی شده است. نتایج ارزیابی کارایی بالایی را برای این الگوریتم ها از جهت کنترل نرخ بیت و همچنین کیفیت ادراکی ویدئوهای کد شده نشان می دهد.