نام پژوهشگر: آرمان دیدنده
آرمان دیدنده محسن افشارچی
در این پایان نامه قصد دارم تا مطالعات متمرکز خود در دوره ی کارشناسی ارشد را گردآوری نمایم. این مطالعات با محوریت «یادگیری عامل های هوش مند از یک دیگر در محیطی پویا و متشکل از تعدادی از عامل های هوش مند ناهم سان» قصد دارد تا هوش مندی لازم برای عامل های موجود در محیط برای یادگیری از یک دیگر را فراهم آورد. برای بررسی یادگیری عوامل هوش مند، عنصر یادگیری را «مفاهیم» تشکیل دهنده ی محیط در نظر گرفتم. از آن جایی که می خواستم بر روی محیط های چندعامله کار کرده باشم، نیاز داشتم تا خاصیت جزیی بودن این گونه محیط ها را به گونه ای پیاده کنم. در نتیجه از نوع خاصی از مفاهیم به نام «مفاهیم ناهم رأی» استفاده کردم. یادگیری مفاهیم را بر مبنای یکی از اشیاء محیط و با استفاده از پروتکل «پرسش و پاسخ» که پروتکل استاندارد ایجاد ارتباط دوبه دو است انجام دادم. هم چنین برای این که مطالعه ی دقیق تری داشته باشیم، مسأله را از دیدگاه «نظریه ی بازی» یا game theory مطالعه نمودم. در نتیجه «بازی یادگیری مفاهیم ناهم رأی» را در دو ساختار مجزای دارای همکاری (cooperative) و دارای رقابت (competitive) بررسی کردم. در این راستا باید اشاره کرد که تمرکز اصلی ما در این پایان نامه بر روی دیدگاه همکاری بین عامل های هوش مند است. با این حال اشاراتی در محل لازم به دیدگاه رقابتی نیز انجام می پذیرد تا اهمیت هر دو دیدگاه به خوبی قابل درک باشد. به همین دلیل باید تمامی پروسه های لازم برای بازی بادگیری مفاهیم را نیز بررسی می کردم. به عنوان مثال هایی از این پروسه ها، روندهای دسته بندی (classification)، رأی گیری (voting) و یادگیری (learning) را مطالعه کردم. برای این که مطالعات مان اثبات عملی نیز داشته باشد و صرفاً به نظریه پردازی نپرداخته باشیم، آزمایش های جداگانه ای برای بررسی عملی ایده های مان ترتیب دادم که در فصل آزمایش ها به آن ها اشاره شده است. در فصل انتهایی نیز مدل کامل یادگیری مفاهیم در یک سامانه ی چندعامله را با مولفه های مطالعه شده آوردم و افق های مطالعات آینده را –با اشاره به مولفه هایی که از این مدل باقی مانده اند- نشان دادم.