نتایج جستجو برای: یادگیری تقویتی q فازی
تعداد نتایج: 155760 فیلتر نتایج به سال:
بهدلیل عدم امکان پیشبینی همه وضعیتهای ممکن برای عاملها در یک سیستم چندعاملهی پویا و گسترده، روشهای یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عاملها میباشد. فوتبال شبیهسازی شده رباتها یک مسئله شناختهشده برای ارزیابی الگوریتمهای یادگیری ماشین روی سیستمهای چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتمهای معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رب...
یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که هدف آن بهبود رفتار عامل بر اساس سیگنال های تقویتی است که از محیط دریافت می کند. مشکل اینجاست که در بسیاری از کاربردهای واقعی، پاداش محیط با تاخیر بسیار زیادی به عامل داده می شود. مشکل دیگر این است که تا زمانی که عامل به یک سطح قابل قبول از یادگیری برسد، تمام حرکات آن تصادفی خواهد بود. ضمناً با پیچیده تر شدن محیط، تعداد وضعیت های مورد اکتشاف و پ...
در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...
هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...
سیستم ترمز ضد قفل و سیستم تعلیق از جمله مهم ترین اجزای ایمنی خودروها هستند که نقش مهمی در تأمین آسایش سرنشینان و تضمین پایداری خودرو دارند. از این رو طراحی کنترل کننده های مناسب برای این اجزا به مسئله مهمی در صنایع خودروسازی تبدیل شده است، از آن جایی که این دو سیستم دارای ساختاری غیرخطی همراه با عدم قطعیت هستند، کنترل کننده های کلاسیک قادر به کنترل آن ها تحت شرایط مختلف و در حضور عدم قطعیت نیست...
سیستم های چندعامله ((mas راه حلی برای مسائل مطرح شده امروزه است که ویژگی هایی مانند توزیع شدگی، پویایی ، تطبیق پذیری، تنومندی، کارایی و قابلیت استفاده مجدد را فراهم می کند. از آنجا که محیط معمولا به اندازه کافی هوشمند نیست تا عاملهای انفرادی را در یک تیم همکارانه تشخیص صلاحیت دهد و سیگنال تقویتی اسکالر منفرد، تنها بازخورد قابل اطمینان است که تیم عامل های یادگیر دریافت می کند، انتساب امتیاز بی...
بحث کنترل ازدحام از اهمیت ویژه ای در مباحث مربوط به شبکه های کامپیوتری برخوردار است. کنترل ناکارآمد ازدحام در شبکه، به آسانی منجر به از کار افتادن شبکه می-شود. یادگیری تقویتی که از داده ها می آموزد همراه با سیستم استنتاج فازی، ابزار هایی عالی برای حل مشکل کنترل ازدحام در شبکه های کامپیوتری با آن طبیعت پیچیده اش هستند.aimd هسته ی مکانیزم اجتناب از ازدحام برای این استاندارد های tcp است. در حالت ...
توانبخشی حرکتی از مباحث مورد توجه محققان است. در اینتحقیق، یک راهکار کنترلی به منظور کنترل حرکت مدلی از بازوی دست با سه مفصل ارائه شده است. در مدل مورد استفاده، اثر فعالسازی همزمان عضلات آگونیست و آنتاگونیست مفصل مچ دست با استفاده از مکانیزم فریز سازی لحاظ شده است. با الهام از عملکرد سیستم اعصاب مرکزی در کسب مهارتهای حرکتی، راهکار کنترلی ارئه شده مبتنی بر یکی از الگوریتم های یادگیری تقویتی توس...
تشخیص و کنترل استرس برمبنای سیگنالهای مقاومت الکتریکی پوست و ضربان قلب با استفاده از یادگیری تقویتی
مقدمه: اختلالات اضطرابی شایعترین وضعیت سلامت روانی است. از طریق تنظیم پاسخ به استرس میتوان اضطراب را کنترل کرد. استرس به طور واضح بر سیستم اعصاب خودمختار اثر میگذارد و منجر به تعریق شدید و افزایش ضربان قلب میشود. روشهای نوینی جهت شناسایی و کنترل استرس هنوز مورد نیاز است. مواد و روشها: در این مقاله اضطراب از طریق یادگیری تقویتی کنترل شده است. برای اندازهگیری سطح استرس، مقاومت الکتریکی پوس...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید