نام پژوهشگر: میثم وکیلی
میثم وکیلی محمد جواد کارگر
در سال های اخیر، مدل های برنامه نویسی مختلفی برای پردازش داده های بزرگ ارائه شده اند. در این میان، mapreduce توانسته است محبوبیت زیادی، به ویژه در محیط های رایانش ابری بدست آورد. mapreduce علاوه بر مزایا و ویژگی های منحصر به فردی که دارد، طبیعتاً دارای چالش های مختلفی نیز هست. مسئله توازن بار یکی از چالش های مهم در مدل های برنامه نویسی توزیع شده از جمله mapreduce است، و در صورتی که سازوکار مناسبی برای آن اتخاذ نشود می تواند باعث افزایش زمان اجرای برنامه ها و در نتیجه کاهش کارایی شود. از جمله معیارهایی که در توازن بار نقش کلیدی دارند، محلیت داده ها و انحراف داده ها هستند. ضمن اینکه برای برقراری توازن بار، باید به همگن یا ناهمگن بودن خوشه های محاسباتی نیز توجه داشت. در این تحقیق، روشی بر اساس کنترل ظرفیت به نام lbc2 ارائه می شود که توازن بار را در mapreduce برای خوشه های ناهمگن بهبود می بخشد. بر اساس ارزیابی ها و آزمایش های انجام شده در این تحقیق، lbc2 با افزایش محلیت داده ها و در نتیجه بهبود توازن بار، زمان اجرا را به طور میانگین حدود 20% بهبود بخشیده است.