یادگیری تقویتی مفاهیم با استفاده از اطلاعات چندگانه سنسوری
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تهران
- نویسنده هادی فیروزی
- استاد راهنما مجید نیلی احمدآبادی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1386
چکیده
چکیده ندارد.
منابع مشابه
پیشبینی روند حرکتی قیمت سهام با استفاده از XCS مبتنی بر الگوریتم ژنتیک و یادگیری تقویتی
پیشرفتها در حوزۀ هوش مصنوعی و یادگیری ماشین بهخصوص درزمینۀ محاسبات تکاملی نهتنها ما را قادر به تجزیهوتحلیل مؤثرتر دادهها نموده است، بلکه این امکان را فراهم ساخته که از آنها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقهمند به توسعه و آزمایش مدلهای رفتاری قیمت سهام بودهاند. XCS سامانهای مرکب از الگوریتم ژنتیک و یادگیری ...
متن کاملبهبود عملکرد حمله در تیم رباتهای فوتبالیست با استفاده از یادگیری تقویتی
بهدلیل عدم امکان پیشبینی همه وضعیتهای ممکن برای عاملها در یک سیستم چندعاملهی پویا و گسترده، روشهای یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عاملها میباشد. فوتبال شبیهسازی شده رباتها یک مسئله شناختهشده برای ارزیابی الگوریتمهای یادگیری ماشین روی سیستمهای چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتمهای معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رب...
متن کاملتنظیم خودکار سختی بازیهای توانبخشی با استفاده از روش یادگیری تقویتی چندتناوبی (یاقوت)
تحقیقات نشان داده است که طراحی فعالیتهای توانبخشی در قالب بازیهای جدی میتواند منجر به انگیزش بیشتر در بیماران شود. درجه سختی چنین بازیهایی معمولاً بهصورت دستی توسط درمانگر تنظیم میشود. این در حالی است که بازیهای توانبخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارتهای بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازیهای توانبخشی ارائه میکند که در آن سختی بازی بهصورت ...
متن کاملتقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی
مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...
متن کاملبهبود عملکرد عاملها در جامعه مصنوعی با استفاده از یادگیری تقویتی
چکیده معمولاً در سیستمهای چندعاملی، تعاملات بین عاملها و تعاملات عاملها با محیط، به صورت انتخاب و اجرای عملهایی از بین مجموعهای محدود از اَعمال مشخص توسط عاملها حاصل میشود. بنابراین نوع و میزان پیچیدگی رفتارهای پیدایشی حاصل از این تعاملات نیز به نحوه اجرا و تعداد رفتارهای قابل اجرا توسط عاملها وابسته است. در این پژوهش سعی شد با توسعه مدل کسب و انتقال تجربه و اضافه کردن قابلیت یادگیری به ...
متن کاملترکیب اندازه شبکه اطلاعات، روشی نوین برای ترکیب اطلاعات سنسوری
ترکیب اطلاعات سنسوری یکی از موضوعات مطرح پژوهشی در کاربردهای مختلف از جمله رباتیک است . در این مقاله مفهومی نوین برای تعمیم روش شناخته شده بیزین برای منابع مستقل اطلاعات معرفی میگردد. بدلیل تنوع وسیعی که در تعریف این اندازه وجود دارد فرمولهای متعددی برای ترکیب مقادیر احتمال مدل شده از عدم قطعیت موجود در اطلاعات سنسوری حاصل میشود. تطابق موجود بین رفتار روش ترکیب پیشنهادی با نتایجی که ذهن بشری ان...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تهران
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023