نام پژوهشگر: الهام کشت گر
الهام کشت گر محمد تشنه لب
در این پایان نامه مسأله مسیریابی بهینه رباتها را در محیط هایی با چند هدف در تناقض باهم با استفاده از الگوریتم های یادگیری تقویتی چندهدفه مورد تحلیل و بررسی قرار می گیرد. اخیرا تحقیقات گسترده ای در زمینه بهینه سازی چندهدفه توسط محققین انجام شده است، نه تنها به علت ماهیت چندهدفه بودن اکثر مسائل دنیای واقعی، بلکه به علت اینکه هنوز بسیاری از سوال های بی جواب در این زمینه وجود دارد. به همین دلایل در زمینه چندهدفه کردن الگوریتم های یادگیری تقویتی نیز اخیرا تحقیقاتی صورت گرفته و الگوریتم های اندکی در این زمینه ارائه شده است. الگوریتم های یادگیری تقویتی چندهدفه شامل دو دسته الگوریتم های تک سیاسته و چندسیاسته هستند که الگوریتم های چندسیاسته از این حیث که نیاز به مقداردهی اولیه برای تعیین اولویت برای اهداف ندارند و راه حل های کلی را ارائه می دهند برای حل مسأله مورد توجه قرار گرفتند و از بین معدود الگوریتم های چندسیاسته الگوریتم chvi برای مسأله مسیریابی مناسب تشخیص داده شد و برای حل مسأله انتخاب شد. سپس یک محیط با چاله هایی در مسیر برای مسأله مسیریابی ربات تعریف شد بدین صورت که اهداف ربات ،به صورت دو هدف در تناقض باهم، یکی رسیدن به نقطه هدف در کوتاهترین زمان ممکن و دیگری اجتناب از چاله ها، در نظر گرفته شدند و مسأله با استفاده از الگوریتم chvi شبیه سازی و حل گردید. اما الگوریتم chvi دارای پیچیدگی محاسباتی بالایی می باشد لذا با الهام از الگوریتم chvi و با تغییر قسمت به روزرسانی مقادیر q یک الگوریتم جدید در زمینه یادگیری تقویتی چندهدفه پیشنهاد می گردد. سپس این الگوریتم روی مسأله ی مسیریابی ربات ها آزمایش گردیده و ثابت می شود که نتایجی مشابه الگوریتم chvi به دست می دهد با این تفاوت که فرآیند آموزش را تقریبا پنج برابر سریعتر طی می کند. در پایان پیچیدگی محاسباتی الگوریتم پیشنهادی محاسبه شده و با پیچیدگی محاسباتی الگوریتم chvi مقایسه گردیده و نشان داده شده است الگوریتم پیشنهادی دارای پیچیدگی محاسباتی کمتری است.