نام پژوهشگر: پویان فضلی
پویان فضلی محمدابراهیم شیری
مربی گری رابطه ای است که در آن یک عامل درباره نحوه عملکرد عامل دیگر در محیط توصیه هایی را به او می کند. این پایان نامه به بررسی و تحلیل مسائلی می پردازد که رو در روی یک عامل مربی خودکار قرار دارند تا این عامل بتواند نصیحت هایی را برای یک یا چند عامل گیرنده نصیحت ایجاد و تولید کند. وظیفه مربی این است که به عامل ها کمک کند تا حد ممکن بهترین عملکرد را در محیط شان داشته باشند. در پیاده سازی یک مربی به مسائل زیر بر می خوریم: 1- مربی چگونه مدل های محیط را بیاموزد و از آن ها استفاده کند. 2- چگونه نصیحت ها با ویژگی های گیرنده های نصیحت سازگار شوند.3- چگونه حریفان مدل شوند و چگونه از این مدل ها استفاده شود.4- نصیحت ها چگونه نمایش داده شوند تا به صورت موثر در یک تیم استفاده شوند. 4- نصیحت ها چگونه نمایش داده شوند تا به صورت موثر در یک تیم استفاده شوند. این پایان نامه از محیط شبیه سازی رویات های فوتبالیست الهام گرفته شده است که در آن یک عامل مربی به یک تیم با زبان استاندارد توصیه هایی را می کند. محیط های شکار -شکارچی و ماز متحرک نیز برای آزمایش های بیشتر مورد استفاده قرار می گیرند. همه الگوریتم ها حداقل در یکی از این محیط ها مورد بررسی قرار می گیرند.