یادگیری تقویتی شبکه عصبی جهت کنترل راه روی یک ربات دوپا

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی فناوریهای نوین
نویسنده یاسمن واقعی
استاد راهنما احمد قنبری سید محمدرضا سید نورانی
سال انتشار 1393

چکیده

در سال های اخیر، تلاش مطالعات انجام شده بر روی الگوریتم های یادگیری به منظور پر کردن فضای خالی بین کنترل بهینه ی تطبیقی و روش های یادگیری برگرفته از سیستم های بیولوژیکی بوده است. یادگیری تقویتی یکی از مهم ترین روش ها است که امروزه جهت کنترل ربات ها مورد استفاده قرار گرفته است. از طرفی، کنترل راه روی ربات دوپا یکی از مهم ترین و پیچیده ترین مسائل با دینامیک غیرخطی می باشد. با توجه به اینکه پژوهش های بسیاری بر روی الگوریتم های یادگیری تقویتی و نیز شبکه های عصبی مصنوعی صورت گرفته است، هیچ یک به استفاده از شبکه های عصبی در الگوریتم یادگیری تقویتی عملگر- منتقد به منظور بهبود عملکرد کنترل ربات دوپا نپرداخته اند. لذا هدف در این پایان نامه، ارائه ی یک روش کنترلی نوین و مبتنی بر یادگیری تقویتی شبکه عصبی جهت کنترل راه روی یک ربات دوپای پنج لینکی صفحه ای می باشد. بدین منظور، در ابتدا به شرح و بررسی مطالعات انجام گرفته در مورد یادگیری تقویتی و ترکیب آن با شبکه ی عصبی پرداخته ایم. سپس، ربات دوپا به صورت سینماتیکی و دینامیکی مدلسازی شده و نیز مدل ریاضی راه روی برای برداشتن گام و ضربه ی گام ارائه شده است. در قدم بعد، یک الگوریتم یادگیری تقویتی موثر عملگر- منتقد جهت کنترل راه روی ربات انتخاب و پیاده سازی شده است. همچنین، به منظور بهینه سازی عملکرد کنترلی سیستم دینامیکی پیچیده ی این ربات، شبکه های عصبی رو به جلو در دو بخش عملگر و منتقد به کار گرفته شده-اند. نتایج حاصل حاکی از آن است که فرآیند یادگیری به سرعت به حالت مطلوب همگرا شده و الگوریتم کنترلی روشی کارا و دقیق جهت کنترل راه روی ربات دوپای پنج لینکی بررسی شده در این پایان نامه می باشد.

منابع مشابه

شبیه سازی و کنترل یک ربات دوپا با استفاده از شبکه عصبی پویا

دراین تحقیق به مدل سازی و کنترل حرکت راه رفتن انسان پرداخته شده است. در بدن انسان تعداد زیادی مفصل وجود دارند که در انجام حرکات مختلف، این مفاصل به حرکت درآمده و انسان را در انجام کارهایش یاری می کنند. یکی از فعالیت های مهم انسان حرکت راه رفتن اوست. در انجام این فعالیت علاوه بر مفاصل پا، مفاصل دست، کمر و گردن برای حفظ تعادل به حرکت در می آیند. بنابراین در ابتدای امر به نظر می رسد که برای شبیه س...

15 صفحه اول

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

مدل‌سازی دینامیکی ترکیبی یک ربات دوپا راه رونده چرخه حدی ناقص عملگر و کنترل آن در برابر اغتشاش خارجی ضربه ای

رباتهای دوپا راه رونده چرخه حدی از نظر مصرف انرژی بسیار کارآمد هستند و حرکات آنها طبیعی و مشابه انسان است، اما قابلیت آنها در دفع اغتشاش خارجی در مقایسه با رباتهایی که بر اساس نقطه ممان صفر راه می روند، به خوبی بررسی نشده است. در این مقاله یک مدل هفت درجه آزادی صفحه ای ترکیبی (گسسته-پیوسته) و ناقص عملگر (چهار عملگر) برای ربات راه رونده چرخه حدی در نظر گرفته شده است. فرض می شود که ربات به هنگام ...

متن کامل

مدلسازی و کنترل ربات دوپا

در این پایان نامه روش استنتاج معادلات حرکت سینماتیکی یک ربات دوپا پنج-لینکی صفحه ای در یک سطح کنترل پذیر برای توصیف حرکت ربات را روی یک سطح افقی تخت بیان شده است. حرکت راه رفتن کامل در طول یک گام شامل سه فاز است که در اینجا معادلات حرکت برای فاز تک تکیه گاه بسط داده شده است. روش بکار رفته برای طراحی پروفایل های زوایای مفاصل ربات دو پا فوق در طی فاز تک تکیه گاه در صفحه جانبی با استفاده از قیودی ...

بهینه سازی و کنترل ربات توانبخش راه رفتن

مقدمه و اهداف در بسیاری از زمینه‌های مربوط به روباتیک در زمینه توانبخشی، تولید گشتاور مطلوب و دقیق با در نظر گرفتن دینامیک موتورها تحقق پیدا می‌کند. در عمل دینامیک موتورها ممکن است ناشناخته باشد و به همین دلیل بسیاری محققان از دینامیک موتورها صرف‌نظر می‌کنند که می‌تواند اثر قابل‌توجهی در نتایج کلی داشته باشد. هدف از این تحقیق، بهینهسازی عملکرد رباتهای توانبخش راه رفتن میباشد. مواد و روش ها ...

متن کامل

کنترل مدل مرجع تطبیقی با جبرانساز شبکه عصبی مصنوعی ربات زیرآبی خودکار6 درجه آزادی

طراحی کنترل‌کننده هوشمند خودتنظیم رباتهای زیرآبی خودکار بدلیل محیط پر اغتشاش زیر آب، دینامیک پیچیده غیرخطی و ناقص عملگر، بسیار چالش برانگیز است. در این مقاله کنترل ترکیبی مدل مرجع تطبیقی همراه با جبرانساز شبکه عصبی مصنوعی برای کنترل ردیاب ربات زیرآبی خودکار 6 درجه آزادی ارائه شده است. سیستم دینامیکی غیرخطی ناقص عملگر 4 ورودی - 6 خروجی شناور زیرآبی بر اساس دو رویکرد تفکیک مدل دینامیکی به چهار زی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی فناوریهای نوین

کلمات کلیدی

یادگیری تقویتی شبکه عصبی کنترل راه روی ربات دوپا

میزبانی شده توسط پلتفرم ابری doprax.com