نام پژوهشگر: مجید نیلی احمدآبادی
زهرا قرایی مجید نیلی احمدآبادی
در این پژوهش هدف، مدلسازی توجه و به کارگیری آن در یادگیری حرکت یک ربات در یک مسیر مشخص می باشد که این رویکرد نهایتا منجر به متغیر شدن زمان نمونه برداری خواهد شد. از میان بستر های گوناگون، ایده کنترل توجه یک عامل هوشمند برگزیده شده است که در قالب یک مسئله یادگیری تقویتی در فضای پیوسته با به کارگیری الگوریتم یادگیری بیزی مطرح می شود. چالش اصلی عامل در طی این یادگیری تصمیم سازی بهینه با در نظر گرفتن محدودیت های زمانی و پردازشی از نقطه نظر دسترسی به منابع سنسوری و به روز رسانی فضای ادراکی جهت در اختیار داشتن درک بهتر از جهان پیرامون، می باشد. بنابراین برای ارضا نمودن محدودیت های موجود از یک سو و رسیدن به یک درک صحیح از موقعیت جهان از سوی دیگر تخمین فضای ادراکی به گونه ای هوشمندانه به کار گرفته شده است، تا عامل بر مبنای نیازها و محدودیت هایش بیاموزد در چه زمانی و چگونه از منابع سنسوری اش بهره بگیرد و چه زمانی با به کارگیری قابلیت های محاسباتی اش از طریق تخمین فضای ادراکی، به شناخت کافی از جهان پیرامون دست یابد. در این پژوهش حالت ها داده های قبلی خود را از دست نمی دهند و تصمیم گیری عامل براساس اطلاعاتی که از قبل پیش بینی شده است، انجام می گیرد. بنابراین باید حالت های گذشته و اثر آن ها برای تصمیم گیری عامل در لحظه ی کنونی نگهداری شوند. هم چنین به دلیل داشتن تعداد محدودی منبع برای گرفتن داده از محیط و هزینه بهره برداری از آن ها عامل در هر لحظه فقط می تواند توجه خود را به یک زیر مجموعه از منابع یا تصمیم گیر های محلی معطوف کند. در نتیجه تغییر جهت توجه باید به صورت بهینه انجام شود، هم چنین زمانی را که عامل برای گرفتن داده از یک منبع دانش سپری می کند ممکن است با سایر منابع برابر نباشد به عبارت دیگر عامل بر حسب نیاز ممکن است نمونه های داده بیشتری را از یک منبع دریافت کند که این امر منجر به متغیر بودن زمان نمونه برداری می شود. برای رسیدن به این اهداف از یک ماشین پیش بین استفاده شده است که در هر بار نمونه گیری ، حالت های بعدی هم پیش بینی می کند. در نتیجه هنگام توجه به یک منبع، عامل عکس العمل مناسب را بر اساس داده های فعلی و همچنین حالت های پیش بینی و نگهداری شده در نمونه گیری های قبلی انجام می دهد. این عکس العمل مناسب شامل تعیین مکان بعدی توجه نیز می شود. یعنی عامل باتوجه به داده های کنونی و داده های ذخیره شده در حافظه اش بهترین جهت برای تغییر مکان توجه و هم چنین بهترین فعل کنشی برای اثر گذاری روی محیط پیرامونش را انجام می دهد. برای تحقق این هدف تخمین پویا و غیر پویای فضای حالت در چارچوب یادگیری وظیفه پیشنهاد شده است. این چارچوب روی روبات e-puck در محیط شبیه سازی رباتیکی وبات آزموده شده است. نتایج شبیه سازی نشان می دهد که روبات می آموزد، چگونه با پرداخت هزینه کمتر که از طریق به کارگیری تخمین فضای حالت به جای به روز رسانی داده های سنسوری حاصل می شود، به یک خط مشی بهینه در تصمیم سازی به منظور یادگیری وظیفه، دست یابد. نتایج آزمایش ها کارایی این چارچوب را نشان می دهند.
شهرام امیری احدبگلو مجید نیلی احمدآبادی
امروزه صنعت خدمات در دنیا در حال تغییر است. تکنولوژیهای جدید روش ارائه خدمت به مشتری را در بسیاری از سازمانهای خدماتی تغییر داده است. می توان گفت قوی ترین نیرو برای ایجاد تغییر در محیط رقابتی امروز تکنولوژی اطلاعات و ارتباطات از راه دور است. یکی از بزرگترین فرصتها و چالشهایی که سازمانهای امروزی با آن مواجه هستند استفاده از تکنولوژیهای مبتنی بر وب است. اینترنت به عنوان یک کانال جدید برای مبادلات اقتصادی منابع جدیدی برای ایجاد درآمد و فرصت در اختیار سازمانها قرار داده است. میزان مبادلات از طریق اینترنت روز به روز در حال افزایش است و شرکتهایی که از این فناوری استفاده نکنند ظرف مدت کوتاهی از صحنه بازار محو خواهند شد در این راستا بانکهای بسیاری در سطح جهان به ارائه خدمات الکترونیکی پرداخته اند. زیرا می دانند که اصل بقای آنها سرعت در ارائه خدمات و اطلاع یافتن از خواست مشتری است. در حال حاضر بخش در حال رشدی از مشتریانی که تمایل دارند عملیات بانکی خود را با استفاده از سیستمهای الکترونیکی و بدون مراجعه به شعبه انجام دهنددرحال پیدایش است یکی از ابزارهای ضروری برای تحقق و گسترش تجارت الکترونیک ، وجود سیستم بانکداری الکترونیک است که همگام با سیستم های جهانی مالی و پولی عمل و فعالیتهای مربوط به تجارت الکترونیک را تسهیل کند. در حقیقت می توان گفت که پیاده سازی تجارت الکترونیک ، نیازمند تحقق بانکداری الکترونیک است. به همین دلیل، استفاده از سیستم های الکترونیک در موسسات مالی و اعتباری جهان به سرعت رو به گسترش بوده و تعداد استفاده کنندگان از خدمات بانکداری الکترونیک روز به روز در حال افزایش هستند. به طور کلی میتوان گفت اساساً بانکداری الکترونیک به فراهم کردن امکان دسترسی مشتریان به خدمات بانکی با استفاده از واسطه های ایمن و بدون حضور فیزیکی اطلاق میشود. ایران در زمینه تجارت و بانکداری الکترونیک ، کشوری جوان است و تا رسیدن به سطحی قابل قبول از آن، راه درازی در پیش دارد. با نگاهی به تجارب کشورهای پیشرفته و رشد خدمات بانکداری الکترونیک می توان نیازهای در حال شکل گیری و روند افزاینده آن را در زمینه خدمات بانکی در ایران تا حد مناسبی پیش بینی کرد. نظر به روشهای سنتی موجود در بانک های کشور و نارسایی این روشها در ارائه خدمات جدید، تهیه زیرساختهای مورد نیاز در بانک ها) زیرساختهای مناسب اقتصادی و اجتماعی) از ضروریاتی است که خوشبختانه مورد توجه مسئولان امر قرار گرفته است و فعالیتهای گسترده ای در سیستم بانکی کشور برای ارائه بانکداری الکترونیک و دیگر خدمات نوین بانکی انجام شده است. مسئله اصلی این تحقیق این است که چه عواملی باعث می شوند که بانکداری الکترونیکی در بانک دولتی بزرگی مانند بانک ملی ایران موفق یا ناموفق شود.
نگین هاشمی مجید نیلی احمدآبادی
امروزه به دلیل پیچیدگی سیستم های رباتیکی نیاز به استراتژی های کارآمدی به منظور استفاده از ربات ها در محیط واقعی وجود دارد. در این میان میزان اطلاعات دریافتی از محیط با رشد روزافزون تعداد حسگرها افزایش می یابد. این در حالی است که عامل هوشمند به دلیل توان پردازشی محدود نیازمند به استفاده بخشی از اطلاعات دریافتی از حسگرها است. مکانیزم های کنترل توجه با استفاده از حالت فعلی عامل هوشمند در محیط بخشی از ورودی اطلاعات حسگرها را به منظور پردازش دقیق و جزئی انتخاب می کنند و عامل براساس حسگرهایی که به آن توجه شده است تصمیم می گیرد چگونه عمل کند. در این پژوهش سعی بر این است تا یادگیری یک وظیفه در چارچوب یادگیری تقویتی بیز به همراه یادگیری کنترل توجه بر روی یک سیستم رانندگی اجرا شود. در روش ارائه شده عامل با ساخت مفاهیم کارکردی و تصمیم گیری در فضای مفاهیم -کنش ها به جای فضای کنش-حالت قابلیت این را پیدا کند تا با دیدن یک موقعیت جدید بتواند آنرا به مفاهیمی که در ذهن خود ایجاد کرده اختصاص دهد و تصمیم گیری کند. در این صورت نیازی نیست عامل تمامی حالت های یک محیط را مشاهده کند. هم چنین به منظور سرعت بخشیدن به استراتژی توجه عامل هوشمند سعی در استفاده از تخمین فضای حالت خود می کند، زیرا با داشتن تخمینی از حالت آینده عامل می تواند گام های توجهی خود را به صورت بهینه انجام دهد. در این راستا ساختار ارائه شده بر روی یک سیستم رانندگی در محیط شبیه سازی webots^tm اجرا شده است و سپس برای بررسی کارآمدی این ساختار، روش پیشنهادی در محیط واقعی توسط ربات ایپاک پیاده سازی شده است. نتایج حاصل از شبیه سازی و پیاده سازی ساختار با وجود موانع ثابت و متحرک و در محیط های متفاوت کارایی این الگوریتم در رویارویی با محیط های جدید را نشان می دهد.
محمدرضا ابوالقاسمی دهاقانی حسین استکی
در این پایان نامه، ما با استفاده از پاسخ سلول های عصبی مربوط به نواحی بینایی که از میمون ماکاک گرفته شده است؛ درصدد یافتن پویایی زمانی بازنمایی اشیا در سطوح مختلف انتزاع هستیم. پاسخ تعداد زیادی از سلول های ناحیه جلویی لب گیجگاهی به مجموعه گسترده ای از تصاویر به کار گرفته شده است. سلول های این ناحیه به تصاویر پیچیده پاسخ می دهند. ما به کمک روش های مختلف رمزنگاری و رمزگشایی، بازنمایی سلسله مراتبیِ سطوح مختلف انتزاع را در جمعیت سلول ها و تک سلول ها، مورد بررسی قرار داده ایم. نتایج ما نشان می دهند که بازنمایی سطوح میانی انتزاع در سلول های تحتانی لب گیجگاهی سریع تر از سطوح دیگر (بالا و پایین) است
هادی فیروزی مجید نیلی احمدآبادی
چکیده ندارد.
احسان نوروزی مجید نیلی احمدآبادی
چکیده ندارد.
شاهین مهدی نژادروشن مجید نیلی احمدآبادی
یکی از اصلی ترین قدمها جهت ایجاد امکان استفاده از رباتهای همکار، طراحی استراتژیهای ساده و پایدار در جهت ایجاد هماهنگی در بین این رباتها در حین انجام وظیفه می باشد. لذا، هدف اصلی این تحقیق تعمیم استراتژی محدودیت -حرکت (constrain-move) برای چهار ربات است که بصورت گسترده (distributed) و با همکاری یکدگیر به سادگی جسم را در جهت قائم حرکت دهند. در پایان نامه، حرکت دادن اجسام به گونه ای بین یک گرو.ه ربات تقسیم می شود که هر ربات مصوب مستقل و با استفاده از اطلاعات سنسوری خود و با رد و بدل نمودن کمترین اطلاعات بصورت استراتیکی وظیفه خود را انجام دهد. در این پایان نامه مشکلات نامعین بوده و به دلیل وجود افزونگی (redundancy) و اثرات آن بر روی پایداری سیستم بررسی شده است و یک الگوریتم همکاری برای بلند کردن اجسام بدون واژگون نمودن آنها در جهت قائم طراحی شده و شریط پایداری این روش بدست آمده است . یک استراتژی کنترلی برای تضمین پایداری تماس ربات و جسم نیز آورده شده است . نتایج شبیه سازی دینامیکی صحت استراتژیهای ارائه شده را تایی می کند.
مسعود اسدپور مجید نیلی احمدآبادی
همکاری در یادگیری در یک سیستم چند عاملی می تواند باعث افزایش سرعت یادگیری و هماهنگی با محیط پیچیده و متغیر گردد. این افزایش سرعت یادگیری به شرط شناخت صحیح افراد خبره در گروه و استفاده مناسب از تجربیات همه عاملها امکان پذیر است . در تحقیقاتی که تاکنون انجام شده است ، شناخت خبره براساس یک معیار ساده و یا با فرض ثابت بودن میزان خبرگی نسبی رباتها بوده است . در این تحقیق با توجه به توصیفات سیستم چند عاملی ، چند معیار مختلف برای درجه بندی میزان خبرگی عوامل معرفی شده است . همچنین براساس معیارهای استفاده شده ، روش جدید اشتراک وزن دار استراتژی برای استفاده هر ربات از دانش دیگر عوامل گروه معرفی می گردد. در این روش ، عاملهای گروه در دو حالت یادگیری مستقل و یادگیری با همکاری آموزش می بینند. یادگیری مستقل عاملها براساس یادگیری تقویتی q - learning صورت می گیرد. پس از چند تلاش یادگیری مستقل ، همکاری در یادگیری آغاز می گردد و دانش یادگیری شده میان عاملها مبادله می گردد. در این مرحله هر عامل به دانش عاملهای دیگر براساس میزان خبرگی آنها وزن مناسب اختصاص داده و در دانش خود تاثیر می دهد. تعیین وزنها براساس میزان خبرگی عاملها وبا یکی از سه فرمول ارائه شده (1) یادگیری از همه ، (2) یادگیری از همه با وزن های مثبت و(3) یادگیری از افراد خبره صورت می گیرد. روشهای تعیین وزنها و معیارهای معرفی شده برای درجه بندی میزان خبرگی عوامل برروی سه بستر تست (هدف و هدف یاب ، بلند کردن اجسام دو بعدی و هل دادن اجسام ) بررسی شده و نتایج با یادگیری مستقل عوامل و روشهای ارائه شده در تحقیقات قبلی مقایسه می شود.
محمدرضا بارونی ابراهیمی مجید نیلی احمدآبادی
در این پایان نامه پس از تحلیل دلایل به وجود آمدن قفل دورانی در یک تیم سه رباته ای محدودکننده جسم، روشی گسترده برای حل مشکل قفل دورانی بدون استفاده از نرمی مطرح شده است . همچنین الگوریتمهای ساده ای برای تشخیص مشکل قفل دورانی آورده شده است . مشکل قفل دورانی برای تعداد چهار و پنج ربات محدودکننده نیز مورد بررسی قرار گرفته و راه حل گسترده رفع آن ارائه شده است . در انتها سیستم شبیه سازی و مشابه سازهای مربوطه برای ارزیابی کارایی الگوریتمها در شرایط مختلف و مقایسه آن با روش استفاده از نرمی در بازوهای ربات مطرح شده است .
پریسا اسلامبولچی لار مجید نیلی احمدآبادی
آنچه که در این پروژه مد نظر است طراحی یک ابزار ارتباطی بین کاربر و راییانه است که نه تنها کاربران سالم بتوانند از آن استفاده کنند بلکه ارتباط افراد معلول را هم با رایانه میسر می سازد .
آرام زایرپور مجید نیلی احمدآبادی
در سالهای اخیر روشهای کنترل گسترده رباتهای همکار بسیار مورد توجه قرار گرفته اند. در الگوریتم های ارائه شده برای حصول هدف ، وظایفی تعیین و بین رباتها تقسیم می شود. یکی از اهداف مهم، حمل اجسام به نقاط مورد نظر و در مسیرهای مشخص است . یکی از روشهای ساده ای که تاکنون مطرح شده، الگوریتم محدودیت - حرکت است . توانایی این الگوریتم در حرکت دادن اجسام در راستای مستقیم و یا چرخاندن آن حول یک نقطه مشخص است . در این پایان نامه با تغییراتی که در کنترل رباتهای مورد استفاده در این روش داده می شود، قابلیت حرکت دادن جسم به صورت گسترده به مسیرهای دلخواه در صفحه دوبعدی تعمیم داده می شود. برای انجام این عمل، رباتها بدون اینکه هیچگونه ارتباط صریحی با هم داشته باشند، به دو گروه تقسیم می شوند که وظیفه یک گروه کنترل مکان جسم و وظیفه گروه دیگر کنترل زاویه جسم است . در این پایان نامه، الگوریتم لازم برای انجام وظیفه فوق مورد بررسی و تحلیل تئوریک قرار گرفته است .
علیرضا آخوندی اصل حمید سلطانیان زاده
در سالهای اخیر استفاده از تصاویر پزشکی برای افزایش میزان موفقیت درمان رشد بسیار زیادی داشته است. به طور کلی استفاده از این تصاویر به پزشک در تشخیص بیماری و وضعیت آن و همچنین انتخاب روش درمان کمک بسیار زیادی می کند. در برخی از موارد بدون استفاده از تصاویر پزشکی تشخیص بسیار سخت و در برخی موارد غیر ممکن است.
طه کوثری مجید نیلی احمدآبادی
یک الگوریتم تشخیص مانع مبتنی بر بینایی یک چشمی برای محیط ایستا با استفاده از جریان نوری ارائه شده است . ایده اصلی از این مشاهده گرفته شده است که جابجایی تصویر مانع و سطح زمین در صفحه تصویر متفاوتند. این تفاوت متناسب با ارتفاع مانع است. در یک سیستم بینایی کالیبره شده، بردارهای تعقیب نقاط در تصویر می توانند مستقیما به میدان حرکت تبدیل شوند. بنابراین ، با دانستن میدان حرکت نقاط یک ناحیه خالی از مانع در تصویر ( مثلا نواحی پایین تصویر) میدان حرکت بقیه نواحی تصویر با فرض عدم وجود مانع در مقابل ربات قابل محاسبه هستند. عمل تشخیص مانع به سادگی با مقایسه میدان حرکت هر ناحیه با میزان مورد انتظار برای آن ناحیه انجام می شود. یک مدل هندسی برای ایده ارائه شده توسعه یافت و اثرات پارامترهای مختلف هندسی و نویز بر حداقل ارتفاع قابل تشخیص به صورت ریاضی و تجربی مطالعه شد. بعلاوه روش ارائه شده با روشهای مبتنی بر واگرایی مقایسه شد.روش ارائه شده بر روی یک ربات متحرک به صورت بی درنگ پیاده سازی شد.
فواد قادری مجید نیلی احمدآبادی
در این تحقیق مساله تحمل پذیری خرابی در ربات های همکار مورد بررسی قرار گرفته است. با توسعه معماری alliance با تاکید بر پشتیبانی کمک اعضای تیم به یکدیگر مکانیزمی برای تحمل پذیری خرابی در ربات های همکار حاصل شده است. در این مدل هیچگونه محدودیتی بر نوع، تعداد و قابلیت های ربات ها وجود ندارد. تصمیم گیری در مورد چگونگی کمک رسانی به صورت کاملا توزیع شده انجام می شود و هر یک از ربات ها براساس میزان بحرانی بودن پیام کم دریافت شده، شرایط محیطی و حالات درونی خود در مورد چگونگی کمک رسانی تصمیم می گیرند. ساختار تصمیم گیری به گونه ای است که می توان انواع پارامترهای مهمی را که در تصمیم گیری برای کمک رسانی اهمیت دارند، در مدل گنجانده و به این ترتیب مدل تصمیم گیری برای هر ماموریت با توجه به وظایف تعریف شده در آن، ویژگی های ربات ها، شرایط محیطی و اهداف گروه بهینه خواهد شد. افزونگی در تعداد و قابلیت های ربات ها به عنوان عاملی برای افزودن تحمل پذیری به تیم ها مورد استفاده قرار می گیرد و مکانیزم و ساختار ارتباطی استفاده شده، نقش موثری در ایجاد هماهنگی بین ربات های همکار ایفا می کند. معماری کنترلی ارائه شده در حالت کلی قابل استفاده در انواع ماموریت ها می باشد و کارآیی قابل توجهی نسبت به سایر روش ها ارائه می نماید. معماری پیشنهادی برای دو تیم رباتی شبیه سازی شده است. در وظیفه هل دادن اجسام هماهنگی دقیق بین ربات ها الزامی نیست. ولی در وظیفه بلند کردن بار در راستای عمودی اعضای گروه باید برای حفظ تعادل جسم و جلوگیری از افزایش بیش از حد بار بر روی ربات ها با هماهنگی دقیقی با یکدیگر فعالیت نمایند. برای ارزیابی قابلیت های معماری شبیه سازی های متعددی انجام شده و نتایج تحلیل شده اند.
محمدعلی عباسی مجید نیلی احمدآبادی
در یادگیری تیمی و هنگامی که مجموعه ای از عامل ها در کنار یکدیگر به یادگیری می پردازند، زمانی می توان یادگیری مناسبی داشت که در آن میزان کارایی هر عامل مشخص باشد و بتوان نقش عاملهای مختلف را به دستی در تیم تعییین کرد. در این صورت می توان براساس نقش و میزان تاثیرگذاری عامل در کار گروهی تیم به وی امتیاز داد. در تحقیقاتی که تاکنون انجام شده است نقش همه عاملهای شرکت کننده در یادگیری را یکسان فرض کرده و براساس آن یادگیری انجام شده است. در این تحقیق که هدف اصلی آن شناخت میزان نقش عاملها در یادگیری تیم است از روش یادگیری تقویتی و الگوریتم q-learning برای یادگیری استفاده شده است و در آن براساس کارایی هر عامل در تیم به وی سیگنال تقویتی داده شده است. معیارهایی که براساس آن کارایی عاملها سنجیده می شود خبرگی عاملهاست. همچنین روشهای تقسیم مساوی سیگنالهای تقویتی و تقسیم تصادفی بین عاملها نیز بررسی شده است و نتایج آن آورده شده است. نتایج، نشان دهنده بهبود یادگیری با استفاده از تقسیم سیگنالهای تقویتی براساس خبرگی عاملها می باشد. آزمایش ها در بستر آزمایشی موسوم به اپیدمی انجام شده است که یک بستر آزمایش جدید و مناسب برای یادگیری گروهی است.
مریم السادات میریان حسین آبادی مجید نیلی احمدآبادی
در این تحقیق ، روشهایی برای ایجاد تحمل پذیری خطا در سیستم های گسترده به ویژه سیستم های چندعامله ارائه شده است. ایجاد تحمل پذیری خطا در سیستم های گسترده، امری دست یافتنی و در عین حال دشوار است.یک سیستم چندعامله به عنوان نمونه مهمی از سیستم های گسترده با بهره گیری از تکنیکهای رایج تحمل پذیری خطا می تواند قابلیت کنار آمدن با انواع متفاوتی از خطاها را پیدا کند. اما آنچه در این تحقیق مورد تاکید است استفاده از ذات چند عامله سیستمها و بهره گیری از تکنیکهایی است که برخاسته از ویژگیهای خاص سیستم های چند عامله است. در روشهای پیشنهادی حاصل از این تحقیق، در صورت بروز مشکلی برای یک یا تعدادی از عامل ها و اطلاع یافتن بقیه از این مطلب به وسیله صادر نمودن درخواست کمک، عاملهای هم تیمی او با اعمال تغییراتی متناسب در وظایف خود سعی در کمک به او می نمایند و وظیفه وی را نیز به دوش می گیرند و تا زمانی که مشکل آن عامل برطرف نشده ، به این روش از کاهش کارایی سیستم جلوگیری می کنند.البته در صورت وجود چندین عامل نیازمند به کمک ، عاملهای کمک رسان براساس الگوریتمی نسبتا بهینه که ایده اصلی آن شبیه اصول زمانبندی وظایف در سیستم های عامل است ، اقدام به انتخاب وظیفه می کنند و بدون برقراری ارتباط صریح، مناسب ترین وظیفه را از لحاظ سرعت و توان پردازشی (عملیاتی) و قابلیت اعتماد خود و نیز درجه اهمیت وظیفه مورد نظر بر عهده می گیرند و از این طریق همکاری ضمنی میان عاملهای کمک رسان برقرار می شود. البته علاوه بر موارد ذکر شده ، به وجود قابلیت های ویژه در عاملهایی که از این توانایی برخوردارند ، نیز توجه شده است که این خود بر منطقی بودن تصمیم گیری در قبال تقسیم وظیفه ها می افزاید.این همکاری با یک تصمیم گیری گسترده و طی چند فاز مختلف صورت می گیرد تا در صورت وجود چندین عامل نیازمند کمک ، در نهایت عاملهایی با اولویت بالاتر برای کمک انتخاب شوند که بیش از بقیه در کارایی کلی تیم موثرند.در تصمیم گیری انجام شده ، مهمترین هدف برآورده نمودن اهداف تحمل پذیری خطاست.
احد هراتی مجید نیلی احمدآبادی
یادگیری چند عامله ، فصل مشترک مبحث نسبتا قدیمی یادگیری ماشین و رویکرد جدید چندعامله در هوش مصنوعی است. با مطرح شدن این موضوع در بسترهای تحقیقاتی سیستم های هوشمند، مسائل جدیدی شکل گرفتند که تا پیش از آن مورد مطالعه واقع نشده بودند. از جمله چنین مسائلی فرایند تقسیم امتیاز در تیمی از عاملهای یادگیر تقویتی است.دراین پژوهش ایده تقسیم امتیاز مبتنی بر دانش مطرح شده ، در قالب شبیه سازی یک سیستم نمونه و نیز پاره ای محاسبات تئوری بررسی می شود. برای این منظور وظایف موازی در محیط قطعی در نظر گرفته شده اند. نشان داده میشود که در صورت استفاده از سوابق یادگیری عاملها برای قضاوت در مورد درستی یا نادرستی اعمال آنها مساله مذکور تاحدی قابل حل است. برای حفظ سابقه یادگیری یا بیان میزان دانش عاملها معیارهای مختلفی مطرح و بررسی می شوند. همچنین نقش اطلاعات جنبی در دسترس عامل نقاد به صورت جداگانه مورد مطالعه قرار می گیرد. علاوه براین روش پیشنهادی با روشهای مقدماتی و ایده آل مقایسه شده ، اثر نایقینی در امتیاز گروهی بر کیفیت کار آن مطالعه می شود.