ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
- نویسنده فاطمه فتحی نژاد
- استاد راهنما ولی درهمی مهدی رضاییان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّر از هر دو الگوریتم یادگیری فوق ارائه می شود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است، بطوریکه ساختار این کنترلگر با ساختار کنترلگر یادگیری سارسایِ فازی که یک الگوریتم آموزش تقویتی پیوسته می باشد، سازگاری دارد. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. در مرحله اول داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزش هر عمل کاندید در قواعد فازی با کمک داده های آموزشی مقداردهی اولیه می شوند. در مرحله دوم از الگوریتم سارسایِ فازی برای تنظیم دقیق تر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیه ساز kiks برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری و کیفیت حرکت ربات می باشد.
منابع مشابه
روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
متن کاملروشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
متن کاملاستخراج ویژگی از دادههای عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخدار
این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات چرخدار در زمینهای هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه مینماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگیهای مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر میباشد. برای این منظور در این مقاله...
متن کاملیادگیری تقویتی برای ربات های فوتبالیست
مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...
توسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله
در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...
15 صفحه اولطراحی و شبیه سازی ناوبری ربات سیاردر زمین های ناهموار با استفاده از الگوریتم یادگیری تقویتی
در این پایان نامه موضوع ناوبری ربات سیار در محیطی با موانع نرم مورد بررسی قرار گرفته است. در سالهای اخیر حرکت رباتهای سیار در محیطهایی که عبور از آنها ممکن اما همراه با هزینه است، نظر بسیاری از محققین را به خود جلب کرده است، به خاطر اینکه به طور گستردهای در رشتههای گوناگون از قبیل اکتشافات فضایی، نظارت زیرآبی، صنایع نظامی، کاربردهای پزشکی، نجات، و غیره استفاده شده است. برای این کاربردها ناو...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023