نتایج جستجو برای: الگوریتم آتوماتای یادگیری تقویتی

تعداد نتایج: 41364  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده مهندسی 1392

در این پایان نامه یک روش کنترلی جدید مبتنی بر روش های کنترل هوشمند، به منظور بهبود عملکرد میرایی سیستم قدرت در برابر نوسانات بین ناحیه ای در ساختار کنترلی ناحیه گسترده ارائه شده است. از آن جا که سیستم قدرت یک سیستم غیرخطی، متغیر با زمان و مرتبه بالاست، کنترل کننده های سنتی که به شیوه های کلاسیک و خطی طراحی می گردند، علی الخصوص برای سیستم های قدرت وسیع امروزی که در معرض اغتشاشات گوناگون قرار دار...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی و مهندسی 1390

یکی از انواع سیستم های غیرخطی، سیستم های هیبریدی می باشند. این سیستم ها دارای چند مود کاری بوده و در هر مود معادلات دینامیکی متفاوتی بر آن ها حاکم است. با شروع کار سیستم از یک شرایط اولیه معین در یک مود، تحت شرایط خاصی سیستم به مودهای دیگر انتقال می یابد. با توجه به ساختار هیبریدی بسیاری از سیستم های صنعتی شامل سیستم های سویچینگ مانند خودروهای هیبریدی، سیستم تعلیق خودرو، خطوط تولید و ... ضرورت ...

احمدرضا پاکرائی

پیشرفت‌ها در حوزۀ هوش مصنوعی و یادگیری ماشین به‌خصوص درزمینۀ محاسبات تکاملی نه‌تنها ما را قادر به تجزیه‌وتحلیل مؤثرتر داده‌ها نموده است، بلکه این امکان را فراهم ساخته که از آن‌ها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقه‌مند به توسعه و آزمایش مدل‌های رفتاری قیمت سهام بوده‌اند. XCS سامانه‌ای مرکب از الگوریتم ژنتیک و یادگیری ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده کشاورزی 1394

روش های توزیع و تحویل آب نقش تعیین کننده در انعطاف پذیری سامانه و بهبود بهره‏وری آب دارند. از میان انواع این روش ها، روش بر حسب درخواست انعطاف پذیری بیشتری نسبت به روش گردشی دارد و نیاز به زیرساخت های پرهزینه روش برحسب تمایل ندارد. چالش موجود در این روش چگونگی استخراج دستورالعمل بهره‏برداری می‏باشد. با توجه به کاربرد موفق سامانه های یادگیری تقویتی در بسیاری از مسائل از جمله صنعت و رباتیک، در ای...

ژورنال: :علوم و فناوری های پدافند نوین 0
محمدرضا حسنی آهنگر mohammad reza hasaniahangar imam hossein universityدانشگاه امام حسین (ع) داریوش فریدنیا dariush faridnia imam hossein universityدانشگاه امام حسین (ع) محمود صالح اصفهانی mahmod saleh esfahani imam hossein universityدانشگاه امام حسین (ع)

چکیده – امروزه بدلیل افزایش ارتباطات بی سیم و لزوم بهره برداری از آن در مناطق مختلف، برپایی و استفاده از شبکه های رایانه ای بی سیم رشد فراوانی داشته است. در این راستا شبکه های سیار موردی نیز به لحاظ داشتن مزایایی چون عدم نیاز به زیر ساخت از پیش تعیین شده، مدیریت مرکزی و نیز تحرک و انعطاف پذیری بالا مورد توجه فراوان قرار گرفته است. از موارد مهم در این گونه شبکه ها موضوع مسیریابی و برقراری ارتباط...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1391

یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دی...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده برق 1392

کمبود شدید طیف و بهره برداری کم از طیف مجاز یک مشکل شبکه های بی سیم است که نیاز فوری به حل دارد. رادیوی شناختی راه حل مناسبی برای رفع این مشکل است. پیش بینی وضعیت طیف کاربران اولیه در رادیوی شناختی برای تخصیص کانال های خالی به کاربران ثانویه و دستیابی پویا به طیف به عنوان یک روش امیدبخش برای بهبود بهره برداری از طیف معرفی شده است. بنابراین به دنبال روشی برای پیش بینی وضعیت کانال در شبکه های راد...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391

یادگیری تقویتی همچونبرنامه ریزی پویادر حل مسائل با فضای حالت پیوسته با چالش نفرین ابعادروبروست. تعمیم ارزش یک حالت به سایر حالت های مجاوربا استفاده از تقریبگرهای عمومی یکی از راهکارهایی است که برای حل این مسئله پیشنهادشده است. در این روش عامل مجموعه ای محدود از فضای حالت را تجربه می کند و از طریق تعمیم دهی تقریب خوبی از کل فضا را بدست می آورد. یکی از بهترین تقریبگرهای عمومیسیستم های فازی اند. د...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - پژوهشکده فنی و مهندسی 1391

در طی دو- سه دهه ی اخیر صنعت برق در سرتاسر جهان، گذار از ساختارهای یک پارچه ی عمودی را به سمت بازارهای آزاد رقابتی آغاز کرده است. با وجود حرکت به سمت فضای رقابتی، متأسفانه این گذار به صورت کامل صورت نگرفته است، و بازارهایی با رقابت ناکامل ایجاد شده اند. در بازاری با رقابت ناکامل، تولید کننده گان درمی یابند که اگر قیمتی بالاتر از هزینه ی حدی شان پیشنهاد دهند ممکن است سود بیشتری به دست آورند. بنا...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید