نام پژوهشگر: نجمه منصوری
نجمه منصوری غلامحسین دستغیبی فرد
گرید داده یک محیط توزیع شده است که با کاربردهای داده متمرکز با حجم بالا سروکار دارد. تکرار داده یکی از تکنیک های کلیدی بهینه سازی برای کاهش تأخیر دستیابی و مدیریت داده های حجیم از طریق ذخیره کردن هوشمندانه کپی های داده است. اگر چه تکرار داده از تکنیک های کلیدی است اما مسئله ی انتخاب محل های مناسب برای قرارگیری تکرارها یعنی مکان یابی تکرار در گرید داده هنوز به صورت وسیعی بررسی نشده است. الگوریتم مکان یابی پیشنهادی تکرار را در مکان مناسب یعنی سایتی که بیشترین تعداد درخواست به آن تکرار خاص را داشته است، قرار می دهد.همچنین به دلیل ظرفیت ذخیره سازی محدود، یک الگوریتم جایگزینی تکرار کارا لازم است. لذا یک استراتژی جایگزینی جدید را ارائه دادیم که در دو مرحله وقتی فضای کافی برای تکرار جدید نباشد فایل ها را حذف می کند: اول فایل هایی را حذف می کند که زمان انتقال کمتری را دارند (یعنی فایل هایی که در شبکه ی محلی یا منطقه ی محلی وجود دارند). دوم، اگر هنوز فضای کافی ایجاد نشده بود از مدل اقتصادی در این مرحله استفاده می کند. زمانبندی یک مسئله سنتی درسیستم های توزیع شده و موازی می باشد ولی خصوصیات خاص و اهداف گرید باعث شده است که روش های پیشنهاد شده دراین محیط ها کارآیی مناسبی برای گرید نداشته باشند. لذا نیاز به ارائه روش هایی مختصِ این محیط احساس می شود. بنابراین یک الگوریتم زمانبندی به نام css که تعداد کارهای منتظر در صف، محل داده های مورد نیاز کار و توانایی محاسباتی سایت ها را در نظر می گیرد، ارائه داده شده است. در نهایت الگوریتم های پیشنهادی با استفاده از شبیه ساز گرید داده، optorsim که توسط پروژه گرید داده اروپا توسعه یافته است، پیاده سازی شدند. نتایج آزمایشات نشان داد که استراتژی های تکرار داده و زمانبندی پیشنهادی بهتر از استراتژی های فعلی عمل می کنند.