نام پژوهشگر: پویا معمارضیا
پویا معمارضیا فرشاد خون جوش
به کار گیری قدرت فوق العاده ی پردازنده های گرافیکی یکی از راه های تثبیت شده برای افزایش کارایی نرم افزار ها است. اما استفاده ی کارآمد از پردازنده های گرافیکی یکی از بزرگ ترین چالش هایی است که برنامه نویسان با آن مواجه شده اند. کارایی برنامه های پردازنده ی گرافیکی وابستگی شدیدی با کارایی حافظه دارد، تا جایی که می توان حافظه ی پردازنده ی گرافیکی را یکی از گلوگاه های بحرانی به حساب آورد. با افزایش روزافزون حجم داده ها و نیاز به کاهش زمان پاسخ نرم افزارها، اهمیت کارایی حافظه بارزتر شده است. هدف این پژوهش بررسی عوامل موثر بر کارایی حافظه، و یافتن راه های افزایش کارایی آن می باشد. برای رسیدن به این هدف، موضوع کارایی حافظه از جنبه های مختلف مورد مطالعه قرار می گیرد. این موارد عبارتند از: انتقال داده ی میان پردازنده ی مرکزی و پردازنده ی گرافیکی، اجرای برنامه بر روی پردازنده ی گرافیکی و دسترسی به سلسله مراتب حافظه، تاثیر بستر های برنامه نویسی بر کارایی، و تحلیل آماری کد سطح میانه. در این پژوهش، از الگوریتم های پردازش تصویر دیجیتال به عنوان مطالعه ی موردی استفاده شده است. علت انتخاب حوزه ی پردازش تصویر دیجیتال این است که از لحاظ پیچیدگی الگوهای دسترسی و میزان مصرف حافظه، متنوع می باشند. نتایج به دست آمده نشان می دهند که در آزمایش های انتقال داده، کارایی تا 1/2 برابر افزایش می یابد. نتایج آزمایش های سلسله مراتب حافظه حاکی از افزایش کارایی تا 21 برابر نسبت به پیکربندی پایه، و نیز تا 146 برابر نسبت به پیاده سازی پردازنده ی مرکزی است. نتایج آزمایش های بستر برنامه نویسی نشان دادند که در یک مقایسه ی منصفانه، کارایی بستر های cuda و opencl در انتقال داده کاملا مشابه است، و در اجرای کرنل به طور میانگین اختلاف کارایی این دو بستر کمتر از 10% می باشد. از نتایج تحلیل کد سطح میانه ی ptx برای مقایسه ی بستر ها استفاده می شود، و رابطه ی بین تناسب ptx با کارایی نسبی را ارزیابی می شود. سرانجام، نشان داده می شود که چگونه می توان با استفاده از تحلیل آماری ptx، گلوگاه یک کرنل را شناسایی و برطرف کرد. در مجموع، نتایج یک تصویر کلی از عوامل موثر بر کارایی حافظه را ترسیم می کنند.