نام پژوهشگر: عصمت پاکیزه حاجی یار
عصمت پاکیزه حاجی یار مازیار پالهنگ
مشارکت کلید اصلی رسیدن به موفقیت در سیستم های طبیعی و مصنوعی به شمار می رود و از این رو مشارکت در سیستم های چندعامله به منظور رسیدن به راه حل های بهتر ضروری به نظر می رسد. انتظار می رود که یادگیری مشارکتی چندعامله در مقایسه با یادگیری مستقل عامل ها، به دلیل دارا بودن دانش و منابع اطلاعاتی بیشتر به نتایج بهتری از نظر کیفی و سرعت یادگیری دست یابد. استفاده از استراتژی های مشارکت بهتر منجر به افزایش سرعت و کیفیت یادگیری می شود. یادگیری مشارکتی نوعی فعالیت یادگیری گروهی سازمان دهی شده است که در آن یادگیری به مبادله اطلاعات ساختار یافته ازنظر اجتماعی ببین یادگیرنده ها بستگی دارد در حالی که هر یادگیرنده به تنهایی مسئول یادگیری خود نیز هست. هدف این پایان نامه ارائه روشی نوین برای پاسخ به این سوال است که "چگونه عامل ها می توانند از مبادله اطلاعات در طول فرآیند یادگیری مشارکتی به منظور دستیابی به عملکرد بهتر از نظر فردی و از نظر عملکرد کلی گروه استفاده کنند؟" تحقیقات در حوزه یادگیری مشارکتی نشان داده اند که در این حوزه دو سوال کلی مطرح است: "چه اطلاعاتی باید بین عامل ها مبادله شود؟" و "اطلاعات به اشتراک گذاشته شده، چگونه باید استفاده شوند؟" . امروزه بیشتر تحقیقات در حوزه یادگیری مشارکتی چندعامله از یادگیری تقویتی به عنوان روش یادگیری پایه خود استفاده می کنند. یادگیری تقویتی به دلیل ساختار یادگیری فاقد نظارت و قابلیت یادگیری پیوسته اش حتی در محیط های پویا، یکی از معتبرترین تکنیک های یادگیری ماشین به شمار می رود. استفاده از این نوع یادگیری در سیستم های چندعامله مشارکتی به هر عامل مستقل این اجازه را می دهد که علاوه بر این که از تجربیات خود می آموزد، از سایر عامل های حاضر در سیستم نیز بیاموزد و بدین ترتیب سرعت یادگیری افزایش یابد. انسان در طول دوره زندگی تجربیات مختلفی را در بازه های زمانی متفاوتی از زندگی اش می آموزد. گاهی تجربیات فرد به طور کامل موفقیت آمیز هستند و گاهی شکستی کامل محسوب می شوند. شخصیت یک فرد بر اساس در نظر گرفتن همه تجربیاتش در کنار هم شکل می گیرد. در واقع تصمیم های هر فرد بر اساس شخصیت شکل گرفته اش اتخاذ می شود. در این پایان نامه سعی بر این است که چنین مفهومی به حوزه یادگیری در سیستم های چندعامله منتقل شود. برای رسیدن به این هدف، در این مطالعه مفهوم جدیدی به نام خبرگی چندمعیاره معرفی شده است که اطلاعات ارزشمندی درباره تجربیات مختلف عامل ها در یک سیستم چندعامله مشارکتی را در بردارد. هم چنین در این پایان نامه الگوریتم یادگیری مشارکتی جدیدی پیشنهاد داده شده است که به منظور رسیدن به مشارکت بهتر از مفهوم خبرگی چندمعیاره استفاده می کند. روش پیشنهادی در مقایسه با سایر روش های موجود توانایی بالایی در استفاده از اطلاعات و دانش موجود دارد که همین امر نیز منجر به عملکرد بالای آن می شود. بیشتر تحقیقات مرتبط در حوزه یادگیری مشارکتی بر روی بهبود یادگیری گروهی به واسطه تغییر جداول q عامل ها با استفاده از اطلاعات انتقال داده شده تمرکز دارند در حالی که در روش پیشنهادی اطلاعات انتقال داده شده بین عامل ها به عنوان راهنما در انتخاب عمل همه عامل ها در نظر گرفته می شود. به عبارت دیگر هر عامل در حالی که دانش جزیی خود را حفظ می کند بوسیله دانش جمعی که در جدول مشارکتی q وجود دارد، هدایت می شود. استفاده از روش پیشنهادی هدایت عامل ها را پایدارتر ساخته است. در واقع یک جدول مشارکتی q مناسب، فرآیند یادگیری را تسریع می کند و در صورتی که مناسب نباشد، جدول q عامل قادر خواهد بود که ناکامل بودن آن را جبران کند. برای ارزیابی روش پیشنهادی از دو محیط آموزشی معتبر پلکان مارپیچ و صید و صیاد استفاده شده است. نتایج آزمایش ها پتانسیل بالای روش پیشنهادی در یادگیری مشارکتی بهتر را تایید می کنند.