الگوریتم آتوماتای یادگیری تقویتی

طراحی کنترلی ناحیه گسترده به منظور بهبود میرایی نوسانات بین ناحیه ای در حضور اندازه گیری ها و کنترل ناحیه گسترده

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده مهندسی 1392

رعنا کلاهدوزی پور, علی حسامی نقشبندی,

در این پایان نامه یک روش کنترلی جدید مبتنی بر روش های کنترل هوشمند، به منظور بهبود عملکرد میرایی سیستم قدرت در برابر نوسانات بین ناحیه ای در ساختار کنترلی ناحیه گسترده ارائه شده است. از آن جا که سیستم قدرت یک سیستم غیرخطی، متغیر با زمان و مرتبه بالاست، کنترل کننده های سنتی که به شیوه های کلاسیک و خطی طراحی می گردند، علی الخصوص برای سیستم های قدرت وسیع امروزی که در معرض اغتشاشات گوناگون قرار دار...

طراحی کنترل کننده هیبریدی فازی توسط الگوریتم اتوماتای یادگیری

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی و مهندسی 1390

محمودرضا معرفت, علی اکبر قره ویسی,

یکی از انواع سیستم های غیرخطی، سیستم های هیبریدی می باشند. این سیستم ها دارای چند مود کاری بوده و در هر مود معادلات دینامیکی متفاوتی بر آن ها حاکم است. با شروع کار سیستم از یک شرایط اولیه معین در یک مود، تحت شرایط خاصی سیستم به مودهای دیگر انتقال می یابد. با توجه به ساختار هیبریدی بسیاری از سیستم های صنعتی شامل سیستم های سویچینگ مانند خودروهای هیبریدی، سیستم تعلیق خودرو، خطوط تولید و ... ضرورت ...

15 صفحه اول

پیش‌بینی روند حرکتی قیمت سهام با استفاده از XCS مبتنی بر الگوریتم ژنتیک و یادگیری تقویتی

ژورنال: دانش مالی تحلیل اوراق بهادار 2017

احمدرضا پاکرائی

پیشرفت‌ها در حوزۀ هوش مصنوعی و یادگیری ماشین به‌خصوص درزمینۀ محاسبات تکاملی نه‌تنها ما را قادر به تجزیه‌وتحلیل مؤثرتر داده‌ها نموده است، بلکه این امکان را فراهم ساخته که از آن‌ها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقه‌مند به توسعه و آزمایش مدل‌های رفتاری قیمت سهام بوده‌اند. XCS سامانه‌ای مرکب از الگوریتم ژنتیک و یادگیری ...

متن کامل

توسعه سامانه بهره برداری بر حسب درخواست در شبکه‏های آبیاری با استفاده از روش یادگیری تقویتی (مطالعه موردی: کانال عقیلی شرقی)

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده کشاورزی 1394

کاظم شاه وردی, محمدجواد منعم,

روش های توزیع و تحویل آب نقش تعیین کننده در انعطاف پذیری سامانه و بهبود بهره‏وری آب دارند. از میان انواع این روش ها، روش بر حسب درخواست انعطاف پذیری بیشتری نسبت به روش گردشی دارد و نیاز به زیرساخت های پرهزینه روش برحسب تمایل ندارد. چالش موجود در این روش چگونگی استخراج دستورالعمل بهره‏برداری می‏باشد. با توجه به کاربرد موفق سامانه های یادگیری تقویتی در بسیاری از مسائل از جمله صنعت و رباتیک، در ای...

ارائه یک روش مسیریابی در شبکه های سیار موردی با استفاده ازتکنیکهای هوش مصنوعی توزیع شده

ژورنال: :علوم و فناوری های پدافند نوین 0

محمدرضا حسنی آهنگر mohammad reza hasaniahangar imam hossein universityدانشگاه امام حسین (ع) داریوش فریدنیا dariush faridnia imam hossein universityدانشگاه امام حسین (ع) محمود صالح اصفهانی mahmod saleh esfahani imam hossein universityدانشگاه امام حسین (ع)

چکیده – امروزه بدلیل افزایش ارتباطات بی سیم و لزوم بهره برداری از آن در مناطق مختلف، برپایی و استفاده از شبکه های رایانه ای بی سیم رشد فراوانی داشته است. در این راستا شبکه های سیار موردی نیز به لحاظ داشتن مزایایی چون عدم نیاز به زیر ساخت از پیش تعیین شده، مدیریت مرکزی و نیز تحرک و انعطاف پذیری بالا مورد توجه فراوان قرار گرفته است. از موارد مهم در این گونه شبکه ها موضوع مسیریابی و برقراری ارتباط...

متن کامل

اکتساب مهارت در یادگیری تقویتی با استفاده از مدل های آماری خوشه بندی گراف

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1391

ابراهیم حبیبی, پرهام مرادی, فردین اخلاقیان طاب,

یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دی...

15 صفحه اول

تخصیص طیف کانال در شبکه رادیوی شناختی با استفاده از یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده برق 1392

لاله کیانی, امیر موسوی نیا, علی احمدی,

کمبود شدید طیف و بهره برداری کم از طیف مجاز یک مشکل شبکه های بی سیم است که نیاز فوری به حل دارد. رادیوی شناختی راه حل مناسبی برای رفع این مشکل است. پیش بینی وضعیت طیف کاربران اولیه در رادیوی شناختی برای تخصیص کانال های خالی به کاربران ثانویه و دستیابی پویا به طیف به عنوان یک روش امیدبخش برای بهبود بهره برداری از طیف معرفی شده است. بنابراین به دنبال روشی برای پیش بینی وضعیت کانال در شبکه های راد...

ارائه یک روش جدید یادگیری تقویتی پیوسته با تاکید بر تحلیل ریاضی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

فرزانه قربانی, ولی درهمی, حسین نظام آبادی پور,

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

15 صفحه اول

الگوریتم های یادگیری تقویتی فازی در محیط های نویزی با استفاده از سیستم های فازی بازه ای

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391

نوشین نصری مهاجری, محمد باقر نقیبی سیستانی,

یادگیری تقویتی همچونبرنامه ریزی پویادر حل مسائل با فضای حالت پیوسته با چالش نفرین ابعادروبروست. تعمیم ارزش یک حالت به سایر حالت های مجاوربا استفاده از تقریبگرهای عمومی یکی از راهکارهایی است که برای حل این مسئله پیشنهادشده است. در این روش عامل مجموعه ای محدود از فضای حالت را تجربه می کند و از طریق تعمیم دهی تقریب خوبی از کل فضا را بدست می آورد. یکی از بهترین تقریبگرهای عمومیسیستم های فازی اند. د...

15 صفحه اول

قیمت دهی در بازار برق به کمک الگوریتم q-learning تطبیقی و قدرت بازار

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - پژوهشکده فنی و مهندسی 1391

رضا کاکولاریمی, محمد باقر نقیبی سیستانی,

در طی دو- سه دهه ی اخیر صنعت برق در سرتاسر جهان، گذار از ساختارهای یک پارچه ی عمودی را به سمت بازارهای آزاد رقابتی آغاز کرده است. با وجود حرکت به سمت فضای رقابتی، متأسفانه این گذار به صورت کامل صورت نگرفته است، و بازارهایی با رقابت ناکامل ایجاد شده اند. در بازاری با رقابت ناکامل، تولید کننده گان درمی یابند که اگر قیمتی بالاتر از هزینه ی حدی شان پیشنهاد دهند ممکن است سود بیشتری به دست آورند. بنا...

15 صفحه اول