گام برداشتن ربات انسان نما با استفاده از گرادیان سیاست در یادگیری تقویتی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
- نویسنده آرش گیوچی
- استاد راهنما مازیار پالهنگ
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
یکی از علاقه مندی های مهم در علم رباتیک، پیاده سازی رباتی دوپا و شبیه به انسان است که قادر باشد همانند انسان رفتار نماید. از میان همه رفتارهای مکانیکی بدن انسان، شاخص ترین آنها راه رفتن است. راه رفتن یک ربات انسان نما، موضوعی است که دامنه های مختلفی از علوم پایه و مهندسی را در بر می گیرد که از آن جمله می توان به زیست شناسی، فیزیولوژی، مهندسی مکانیک، مهندسی کنترل ، هوش مصنوعی و رباتیک اشاره نمود. از منظر هوش مصنوعی، یادگیری تقویتی در محیط پیوسته یک روش کنترلی مناسب برای یادگیری رفتارهایی است که نیاز دارند تا به صورتی نرم، یکنواخت و پیوسته تحت کنترل قرار گیرند. این روش یادگیری در سالهای اخیر بسیار مورد توجه دانشمندان علم کنترل و هوش مصنوعی واقع شده است و در بسیاری از آزمون های کنترلی از جمله راه رفتن یک ربات دوپا ، به عنوان یک روش مبتنی برآزمون و خطا که تجربه کردن را از طریق تعامل و محاوره با محیط پیرامون می اندوزد، استفاده گردیده است. آنچه در این پژوهش به انجام رسیده است، ارائه روشی مبتنی بر یکی از روشهای یادگیری تقویتی تحت عنوان روش گرادیان سیاست است که برای یادگیری گام برداشتن به عنوان عمل پایه در فرآیند راه رفتن برای یک ربات انسان نما تعریف می شود. در روش ارائه شده، طرح ریزی حرکت با استفاده از تفکیک یک گام به دو زیر رفتار اعمال می شود. از طرفی فرآیند یادگیری به دو زیر فرآیند یادگیری تعادل ویادگیری کاهش خطای ژیرسکوپ، تفکیک می شود. فرآیند اول یادگیری با استفاده از روش سریع مبتنی بر گرادیان سیاست اعمال می گردد و در فرآیند دوم یادگیری، استفاده از یک جستجوی تپه نوردی ساده همراه با روش گرادیانی برای همگرایی به رفتاری پایدار جهت گام برداشتن، کارگشا خواهد بود. در نهایت، نتایج یادگیری حاکی از آن است که ربات در هر دو فاز حرکتی علاوه بر تعادل توانسته است، میزان "لق خوردن" که مبتنی بر خطای ژیرسکوپ تعریف می شود را کاهش دهد و سرعت حرکت موتورهایش را در کنار یادگیری توابع حرکتی تنظیم نماید تا در نهایت علاوه بر سرعت همگرایی، سرعت راه رفتن خود را نیز افزایش دهد. کلمات کلیدی: 1- ربات انسان نما 2-یادگیری تقویتی پیوسته 3-گرادیان سیاست 4-ژیرسکوپ 5- تپه نوردی
منابع مشابه
تحلیل سینماتیکی- سینتیکی پیمایش مستقیم الخط ربات انسان نما
محمود سعادت فومنی1، محمد مهدی خطیبی2،*، مهدی مرادی3، مرتضی کارآموز مهدی آبادی3 اطلاعات مقاله چکیده دریافت مقاله: آذر 1387 پذیرش مقاله: تیر 1387 بررسیها و مطالعات صورت گرفته در زمینه رباتهای انسان نما، شناخت دقیق پارامترهای دینامیکی ربات را لازمه اجرای یک حرکت شبه انسانی دانستهاند. تعداد درجات آزادی بالای این نوع رباتها، رسیدن به این شناخت را به مراتب پیچیدهتر میکند. در...
متن کاملروشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملبرنامه ریزی سریع و کارآمد گام برای ربات انسان نما تحت اغتشاش خارجی
در رباتیک، برنامه ریزی گام (محل فرود گام جدید و مدت زمان گام) برای ربات انسان نما، به دلیل ناقص عملگر بودن و داشتن درجات آزادی بالا، هنوز هم مساله ای چالشی و پیچیده است. این مساله در حضور اغتشاشات خارجی که تعادل ربات را برهم می زنند، بغرنج تر هم می شود. در این پروژه، هدف این است که بدون در نظر گرفتن مسیرهای از پیش تعیین شده، مساله برنامه ریزی گام در برابر اغتشاش خارجی برای ربات حل شود تا ربات ب...
تحلیل سینماتیکی- سینتیکی پیمایش مستقیم الخط ربات انسان نما
محمود سعادت فومنی1، محمد مهدی خطیبی2،*، مهدی مرادی3، مرتضی کارآموز مهدی آبادی3 اطلاعات مقاله چکیده دریافت مقاله: آذر 1387 پذیرش مقاله: تیر 1387 بررسیها و مطالعات صورت گرفته در زمینه رباتهای انسان نما، شناخت دقیق پارامترهای دینامیکی ربات را لازمه اجرای یک حرکت شبه انسانی دانستهاند. تعداد درجات آزادی بالای این نوع رباتها، رسیدن به این شناخت را به مراتب پیچیدهتر میکند. در ا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023