اتوماتای یادگیری تقویتی پیوسته

اکتساب مهارت در یادگیری تقویتی رباتیک توسط عاملهای خودمختار

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393

فاطمه تلگردی, علی اکبر پویان, سعید شیری قیداری, علیرضا خلیلیان,

یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که هدف آن بهبود رفتار عامل بر اساس سیگنال های تقویتی است که از محیط دریافت می کند. مشکل اینجاست که در بسیاری از کاربردهای واقعی، پاداش محیط با تاخیر بسیار زیادی به عامل داده می شود. مشکل دیگر این است که تا زمانی که عامل به یک سطح قابل قبول از یادگیری برسد، تمام حرکات آن تصادفی خواهد بود. ضمناً با پیچیده تر شدن محیط، تعداد وضعیت های مورد اکتشاف و پ...

طراحی کنترل کننده سیستم ترمز ضد قفل خودرو با روش اتوماتای یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان 1386

مهرناز آقاخانی مراد, علی اکبر قره ویسی,

چکیده ندارد.

15 صفحه اول

حذف نویز صوتی تناوبی با روش فعال و هوشمند

ژورنال: :مکانیک سازه ها و شاره ها 2013

بهروز رئیسی شاپور گلبهار حقیقی علی اکبر صفوی

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

متن کامل

کنترل کننده مقاوم تطبیقی بار فرکانس مبتنی بر یادگیری تقویتی برای یک سیستم قدرت به هم پیوسته شامل smes

ژورنال: :مهندسی برق دانشگاه تبریز 0

عادل اکبری مجد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حسین شایقی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حمید محمدنژاد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق عبداله یونسی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...

متن کامل

چگونگی تسهیم پاداش بین عامل ها در سیستم های چند عامله

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر 1390

سمیرا نظری, محمدابراهیم شیری, بهرام صادقی بی غم,

سیستم های چندعامله ((mas راه حلی برای مسائل مطرح شده امروزه است که ویژگی هایی مانند توزیع شدگی، پویایی ، تطبیق پذیری، تنومندی، کارایی و قابلیت استفاده مجدد را فراهم می کند. از آنجا که محیط معمولا به اندازه کافی هوشمند نیست تا عاملهای انفرادی را در یک تیم همکارانه تشخیص صلاحیت دهد و سیگنال تقویتی اسکالر منفرد، تنها بازخورد قابل اطمینان است که تیم عامل های یادگیر دریافت می کند، انتساب امتیاز بی...

15 صفحه اول

راهکارکنترل مقاوم مبتنی بر یادگیری تقویتی به منظور توانبخشی حرکتی بازوی دست

ژورنال: کنترل 2013

بوستانی, رضا, حسن زاده بنابیدی, زهرا, طوسی زاده, سعید, کبروی, حمیدرضا,

توانبخشی حرکتی از مباحث مورد توجه محققان است. در اینتحقیق، یک راهکار کنترلی به منظور کنترل حرکت مدلی از بازوی دست با سه مفصل ارائه شده است. در مدل مورد استفاده، اثر فعالسازی همزمان عضلات آگونیست و آنتاگونیست مفصل مچ دست با استفاده از مکانیزم فریز سازی لحاظ شده است. با الهام از عملکرد سیستم اعصاب مرکزی در کسب مهارتهای حرکتی، راهکار کنترلی ارئه شده مبتنی بر یکی از الگوریتم های یادگیری تقویتی توس...

متن کامل

تشخیص و کنترل استرس برمبنای سیگنال‌های مقاومت الکتریکی پوست و ضربان قلب با استفاده از یادگیری تقویتی

ژورنال: مجله علوم اعصاب شفای خاتم 2018

باشی زاده فخار, مینوچهر, سادات غفوریان, ماندانا, نوری, امین,

مقدمه: اختلالات اضطرابی شایع‌ترین وضعیت سلامت روانی است. از طریق تنظیم پاسخ به استرس می‌توان اضطراب را کنترل کرد. استرس به طور واضح بر سیستم اعصاب خودمختار اثر می‌گذارد و منجر به تعریق شدید و افزایش ضربان قلب می‌شود. روش‌های نوینی جهت شناسایی و کنترل استرس هنوز مورد نیاز است. مواد و روش‌ها: در این مقاله اضطراب از طریق یادگیری تقویتی کنترل شده است. برای اندازه‌گیری سطح استرس، مقاومت الکتریکی پوس...

متن کامل

شبکه عصبی فازی خودکار مبتنی بر جمعیت برای یادگیری آنلاین مبتنی بر دانش

ژورنال: :مهندسی برق مدرس 0

mohammad reza keyvanpour associate professor at computer engineering department, alzahra university, vanak village street, tehran, iran hajar homayouni phd candidate at computer engineering department, university of isfahan, iran samaneh zolfaghari msc student at computer engineering department, alzahra university, tehran, iran

در این مقاله، یک سیستم پیوندگرای فازی جدید برای یادگیری آنلاین تدریجی و کشف دانش، به نام شبکه عصبی فازی خودکار مبتنی بر جمعیت (pafunn) با جزئیات نشان داده است. pafunn از طریق یادگیری تدریجی تکامل پیدا می کند. اتصالات و نرون های جدید، بر اساس جمعیت نمونه ها ایجاد می شوند، در حالی که در سیستمی عمل می کنند که مزیت کنترل تعدادی از نرون های درگیر در آن را داشته و منجر به پیچیدگی کمتر شبکه می شوند. ا...

متن کامل

یادگیری تقویتی شبکه عصبی جهت کنترل راه روی یک ربات دوپا

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی فناوریهای نوین 1393

یاسمن واقعی, احمد قنبری, سید محمدرضا سید نورانی,

در سال های اخیر، تلاش مطالعات انجام شده بر روی الگوریتم های یادگیری به منظور پر کردن فضای خالی بین کنترل بهینه ی تطبیقی و روش های یادگیری برگرفته از سیستم های بیولوژیکی بوده است. یادگیری تقویتی یکی از مهم ترین روش ها است که امروزه جهت کنترل ربات ها مورد استفاده قرار گرفته است. از طرفی، کنترل راه روی ربات دوپا یکی از مهم ترین و پیچیده ترین مسائل با دینامیک غیرخطی می باشد. با توجه به اینکه پژوهش ...

هماهنگ سازی سیستم های چندعامله با استفاده از اتوماتاهای یادگیر

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386

زهرا جباری, محمدرضا میبدی,

در این پایان نامه به حل دو مسأله با استفاده از راهکار های غیر متمرکز و مبتنی یادگیری تقویتی پرداخته شده است. در مسأله ی نخست، کاربرد اتوماتاهای یادگیر در ایجاد هماهنگی در یک سیستم چندعامله مورد بررسی قرار گرفته است. در مسأله ی فوق از اتوماتاهای یادگیر در فضایی سلولی برای هماهنگ سازی و یا به عبارت بهتر گردآوری و خوشه بندی عوامل همسان استفاده شده است. مسأله ی دوم در حوزه ی شبکه های موردی مطرح شده...

15 صفحه اول