نام پژوهشگر: مرضیه موسویان
مرضیه موسویان بیتا شادگار
یادگیری از مهم ترین مسائل مطرح در سیستم های چندپیشکاره است. این سیستم ها شامل چندین پیشکار هستند که با یکدیگر تعامل دارند. در چنین سیستم هایی رفتار پیشکار ها قابل پیش بینی نیست، بنابراین لازم است که پیشکارها از محیط اطرافشان بیاموزند و خود را با آن سازگار کنند. پیشکارها برای یادگیری، نیازمند مدل ها و الگوریتم های یادگیری هستند. در این پایان نامه مدل یادگیری مبتنی بر مشاهده، که با نام یادگیری تقلیدی نیز شناخته می شود بررسی می شود. استدلال مبتنی بر مورد، یکی از معمول ترین روش ها برای پیاده سازی یادگیری تقلیدی است. ملاحظه می شود که در محیط های پیچیده ارائه مدلی از یادگیری ضرورت دارد.این تحقیق ابتدا با استفاده از یادگیری تقلیدی پیشکار را در محیط دو بعدی فوتبال شبیه سازی کرده، سپس به منظور افزایش کارایی در یادگیری، از الگوریتم های تکاملی برای تخمین مقدار بهینه پارامترهااستفاده می شود. برای این منظور از ترکیب مناسبی از الگوریتم های تکاملی، یعنی الگوریتم ژنتیک و تبرید تدریجی استفاده می شود. نتایج نشان می دهد که استفاده از این الگوریتم ها، سبب افزایش سرعت پردازش، کارایی و نرخ همگرایی سیستم می شود.