نام پژوهشگر: نگین هاشمی
نگین هاشمی مجید نیلی احمدآبادی
امروزه به دلیل پیچیدگی سیستم های رباتیکی نیاز به استراتژی های کارآمدی به منظور استفاده از ربات ها در محیط واقعی وجود دارد. در این میان میزان اطلاعات دریافتی از محیط با رشد روزافزون تعداد حسگرها افزایش می یابد. این در حالی است که عامل هوشمند به دلیل توان پردازشی محدود نیازمند به استفاده بخشی از اطلاعات دریافتی از حسگرها است. مکانیزم های کنترل توجه با استفاده از حالت فعلی عامل هوشمند در محیط بخشی از ورودی اطلاعات حسگرها را به منظور پردازش دقیق و جزئی انتخاب می کنند و عامل براساس حسگرهایی که به آن توجه شده است تصمیم می گیرد چگونه عمل کند. در این پژوهش سعی بر این است تا یادگیری یک وظیفه در چارچوب یادگیری تقویتی بیز به همراه یادگیری کنترل توجه بر روی یک سیستم رانندگی اجرا شود. در روش ارائه شده عامل با ساخت مفاهیم کارکردی و تصمیم گیری در فضای مفاهیم -کنش ها به جای فضای کنش-حالت قابلیت این را پیدا کند تا با دیدن یک موقعیت جدید بتواند آنرا به مفاهیمی که در ذهن خود ایجاد کرده اختصاص دهد و تصمیم گیری کند. در این صورت نیازی نیست عامل تمامی حالت های یک محیط را مشاهده کند. هم چنین به منظور سرعت بخشیدن به استراتژی توجه عامل هوشمند سعی در استفاده از تخمین فضای حالت خود می کند، زیرا با داشتن تخمینی از حالت آینده عامل می تواند گام های توجهی خود را به صورت بهینه انجام دهد. در این راستا ساختار ارائه شده بر روی یک سیستم رانندگی در محیط شبیه سازی webots^tm اجرا شده است و سپس برای بررسی کارآمدی این ساختار، روش پیشنهادی در محیط واقعی توسط ربات ایپاک پیاده سازی شده است. نتایج حاصل از شبیه سازی و پیاده سازی ساختار با وجود موانع ثابت و متحرک و در محیط های متفاوت کارایی این الگوریتم در رویارویی با محیط های جدید را نشان می دهد.