گام برداشتن ربات انسان نما با استفاده از گرادیان سیاست در یادگیری تقویتی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
  • نویسنده آرش گیوچی
  • استاد راهنما مازیار پالهنگ
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1390
چکیده

یکی از علاقه مندی های مهم در علم رباتیک، پیاده سازی رباتی دوپا و شبیه به انسان است که قادر باشد همانند انسان رفتار نماید. از میان همه رفتارهای مکانیکی بدن انسان، شاخص ترین آنها راه رفتن است. راه رفتن یک ربات انسان نما، موضوعی است که دامنه های مختلفی از علوم پایه و مهندسی را در بر می گیرد که از آن جمله می توان به زیست شناسی، فیزیولوژی، مهندسی مکانیک، مهندسی کنترل ، هوش مصنوعی و رباتیک اشاره نمود. از منظر هوش مصنوعی، یادگیری تقویتی در محیط پیوسته یک روش کنترلی مناسب برای یادگیری رفتارهایی است که نیاز دارند تا به صورتی نرم، یکنواخت و پیوسته تحت کنترل قرار گیرند. این روش یادگیری در سالهای اخیر بسیار مورد توجه دانشمندان علم کنترل و هوش مصنوعی واقع شده است و در بسیاری از آزمون های کنترلی از جمله راه رفتن یک ربات دوپا ، به عنوان یک روش مبتنی برآزمون و خطا که تجربه کردن را از طریق تعامل و محاوره با محیط پیرامون می اندوزد، استفاده گردیده است. آنچه در این پژوهش به انجام رسیده است، ارائه روشی مبتنی بر یکی از روشهای یادگیری تقویتی تحت عنوان روش گرادیان سیاست است که برای یادگیری گام برداشتن به عنوان عمل پایه در فرآیند راه رفتن برای یک ربات انسان نما تعریف می شود. در روش ارائه شده، طرح ریزی حرکت با استفاده از تفکیک یک گام به دو زیر رفتار اعمال می شود. از طرفی فرآیند یادگیری به دو زیر فرآیند یادگیری تعادل ویادگیری کاهش خطای ژیرسکوپ، تفکیک می شود. فرآیند اول یادگیری با استفاده از روش سریع مبتنی بر گرادیان سیاست اعمال می گردد و در فرآیند دوم یادگیری، استفاده از یک جستجوی تپه نوردی ساده همراه با روش گرادیانی برای همگرایی به رفتاری پایدار جهت گام برداشتن، کارگشا خواهد بود. در نهایت، نتایج یادگیری حاکی از آن است که ربات در هر دو فاز حرکتی علاوه بر تعادل توانسته است، میزان "لق خوردن" که مبتنی بر خطای ژیرسکوپ تعریف می شود را کاهش دهد و سرعت حرکت موتورهایش را در کنار یادگیری توابع حرکتی تنظیم نماید تا در نهایت علاوه بر سرعت همگرایی، سرعت راه رفتن خود را نیز افزایش دهد. کلمات کلیدی: 1- ربات انسان نما 2-یادگیری تقویتی پیوسته 3-گرادیان سیاست 4-ژیرسکوپ 5- تپه نوردی

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تحلیل سینماتیکی- سینتیکی پیمایش مستقیم الخط ربات انسان نما

  محمود سعادت فومنی1، محمد مهدی خطیبی2،*، مهدی مرادی3، مرتضی کارآموز مهدی آبادی3       اطلاعات مقاله     چکیده   دریافت مقاله: آذر 1387   پذیرش مقاله: تیر 1387     بررسی‏ها و مطالعات صورت گرفته در زمینه ربات‏های انسان نما، شناخت دقیق پارامترهای دینامیکی ربات را لازمه اجرای یک حرکت شبه انسانی دانسته‏اند. تعداد درجات آزادی بالای این نوع ربات‏ها، رسیدن به این شناخت را به مراتب پیچیده‏تر می‏کند. در...

متن کامل

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

برنامه ریزی سریع و کارآمد گام برای ربات انسان نما تحت اغتشاش خارجی

در رباتیک، برنامه ریزی گام (محل فرود گام جدید و مدت زمان گام) برای ربات انسان نما، به دلیل ناقص عملگر بودن و داشتن درجات آزادی بالا، هنوز هم مساله ای چالشی و پیچیده است. این مساله در حضور اغتشاشات خارجی که تعادل ربات را برهم می زنند، بغرنج تر هم می شود. در این پروژه، هدف این است که بدون در نظر گرفتن مسیرهای از پیش تعیین شده، مساله برنامه ریزی گام در برابر اغتشاش خارجی برای ربات حل شود تا ربات ب...

تحلیل سینماتیکی- سینتیکی پیمایش مستقیم الخط ربات انسان نما

محمود سعادت فومنی1، محمد مهدی خطیبی2،*، مهدی مرادی3، مرتضی کارآموز مهدی آبادی3       اطلاعات مقاله     چکیده   دریافت مقاله: آذر 1387   پذیرش مقاله: تیر 1387     بررسی‏ها و مطالعات صورت گرفته در زمینه ربات‏های انسان نما، شناخت دقیق پارامترهای دینامیکی ربات را لازمه اجرای یک حرکت شبه انسانی دانسته‏اند. تعداد درجات آزادی بالای این نوع ربات‏ها، رسیدن به این شناخت را به مراتب پیچیده‏تر می‏کند. در ا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023