نتایج جستجو برای: اتوماتای یادگیری تقویتی پیوسته

تعداد نتایج: 30376  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393

یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که هدف آن بهبود رفتار عامل بر اساس سیگنال های تقویتی است که از محیط دریافت می کند. مشکل اینجاست که در بسیاری از کاربردهای واقعی، پاداش محیط با تاخیر بسیار زیادی به عامل داده می شود. مشکل دیگر این است که تا زمانی که عامل به یک سطح قابل قبول از یادگیری برسد، تمام حرکات آن تصادفی خواهد بود. ضمناً با پیچیده تر شدن محیط، تعداد وضعیت های مورد اکتشاف و پ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان 1386

چکیده ندارد.

ژورنال: :مکانیک سازه ها و شاره ها 2013
بهروز رئیسی شاپور گلبهار حقیقی علی اکبر صفوی

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

ژورنال: :مهندسی برق دانشگاه تبریز 0
عادل اکبری مجد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حسین شایقی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حمید محمدنژاد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق عبداله یونسی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر 1390

سیستم های چندعامله ((mas راه حلی برای مسائل مطرح شده امروزه است که ویژگی هایی مانند توزیع شدگی، پویایی ، تطبیق پذیری، تنومندی، کارایی و قابلیت استفاده مجدد را فراهم می کند. از آنجا که محیط معمولا به اندازه کافی هوشمند نیست تا عاملهای انفرادی را در یک تیم همکارانه تشخیص صلاحیت دهد و سیگنال تقویتی اسکالر منفرد، تنها بازخورد قابل اطمینان است که تیم عامل های یادگیر دریافت می کند، انتساب امتیاز بی...

ژورنال: کنترل 2013

توانبخشی حرکتی از مباحث مورد توجه محققان است. در اینتحقیق، یک راهکار کنترلی به منظور کنترل حرکت مدلی از بازوی دست با سه مفصل ارائه شده است. در مدل مورد استفاده، اثر فعالسازی همزمان عضلات آگونیست و آنتاگونیست مفصل مچ دست با استفاده از مکانیزم فریز سازی لحاظ شده است. با الهام از عملکرد سیستم اعصاب مرکزی در کسب مهارتهای حرکتی، راهکار کنترلی ارئه شده مبتنی بر یکی از الگوریتم های یادگیری تقویتی توس...

باشی زاده فخار, مینوچهر, سادات غفوریان, ماندانا, نوری, امین,

مقدمه: اختلالات اضطرابی شایع‌ترین وضعیت سلامت روانی است. از طریق تنظیم پاسخ به استرس می‌توان اضطراب را کنترل کرد. استرس به طور واضح بر سیستم اعصاب خودمختار اثر می‌گذارد و منجر به تعریق شدید و افزایش ضربان قلب می‌شود. روش‌های نوینی جهت شناسایی و کنترل استرس هنوز مورد نیاز است. مواد و روش‌ها: در این مقاله اضطراب از طریق یادگیری تقویتی کنترل شده است. برای اندازه‌گیری سطح استرس، مقاومت الکتریکی پوس...

ژورنال: :مهندسی برق مدرس 0
mohammad reza keyvanpour associate professor at computer engineering department, alzahra university, vanak village street, tehran, iran hajar homayouni phd candidate at computer engineering department, university of isfahan, iran samaneh zolfaghari msc student at computer engineering department, alzahra university, tehran, iran

در این مقاله، یک سیستم پیوندگرای فازی جدید برای یادگیری آنلاین تدریجی و کشف دانش، به نام شبکه عصبی فازی خودکار مبتنی بر جمعیت (pafunn) با جزئیات نشان داده است. pafunn از طریق یادگیری تدریجی تکامل پیدا می کند. اتصالات و نرون های جدید، بر اساس جمعیت نمونه ها ایجاد می شوند، در حالی که در سیستمی عمل می کنند که مزیت کنترل تعدادی از نرون های درگیر در آن را داشته و منجر به پیچیدگی کمتر شبکه می شوند. ا...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی فناوریهای نوین 1393

در سال های اخیر، تلاش مطالعات انجام شده بر روی الگوریتم های یادگیری به منظور پر کردن فضای خالی بین کنترل بهینه ی تطبیقی و روش های یادگیری برگرفته از سیستم های بیولوژیکی بوده است. یادگیری تقویتی یکی از مهم ترین روش ها است که امروزه جهت کنترل ربات ها مورد استفاده قرار گرفته است. از طرفی، کنترل راه روی ربات دوپا یکی از مهم ترین و پیچیده ترین مسائل با دینامیک غیرخطی می باشد. با توجه به اینکه پژوهش ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386

در این پایان نامه به حل دو مسأله با استفاده از راهکار های غیر متمرکز و مبتنی یادگیری تقویتی پرداخته شده است. در مسأله ی نخست، کاربرد اتوماتاهای یادگیر در ایجاد هماهنگی در یک سیستم چندعامله مورد بررسی قرار گرفته است. در مسأله ی فوق از اتوماتاهای یادگیر در فضایی سلولی برای هماهنگ سازی و یا به عبارت بهتر گردآوری و خوشه بندی عوامل همسان استفاده شده است. مسأله ی دوم در حوزه ی شبکه های موردی مطرح شده...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید