نتایج جستجو برای: الگوریتم یادگیری تقویتی

تعداد نتایج: 41353  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده کشاورزی 1394

روش های توزیع و تحویل آب نقش تعیین کننده در انعطاف پذیری سامانه و بهبود بهره‏وری آب دارند. از میان انواع این روش ها، روش بر حسب درخواست انعطاف پذیری بیشتری نسبت به روش گردشی دارد و نیاز به زیرساخت های پرهزینه روش برحسب تمایل ندارد. چالش موجود در این روش چگونگی استخراج دستورالعمل بهره‏برداری می‏باشد. با توجه به کاربرد موفق سامانه های یادگیری تقویتی در بسیاری از مسائل از جمله صنعت و رباتیک، در ای...

ژورنال: :علوم و فناوری های پدافند نوین 0
محمدرضا حسنی آهنگر mohammad reza hasaniahangar imam hossein universityدانشگاه امام حسین (ع) داریوش فریدنیا dariush faridnia imam hossein universityدانشگاه امام حسین (ع) محمود صالح اصفهانی mahmod saleh esfahani imam hossein universityدانشگاه امام حسین (ع)

چکیده – امروزه بدلیل افزایش ارتباطات بی سیم و لزوم بهره برداری از آن در مناطق مختلف، برپایی و استفاده از شبکه های رایانه ای بی سیم رشد فراوانی داشته است. در این راستا شبکه های سیار موردی نیز به لحاظ داشتن مزایایی چون عدم نیاز به زیر ساخت از پیش تعیین شده، مدیریت مرکزی و نیز تحرک و انعطاف پذیری بالا مورد توجه فراوان قرار گرفته است. از موارد مهم در این گونه شبکه ها موضوع مسیریابی و برقراری ارتباط...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1391

یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دی...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391

یادگیری تقویتی همچونبرنامه ریزی پویادر حل مسائل با فضای حالت پیوسته با چالش نفرین ابعادروبروست. تعمیم ارزش یک حالت به سایر حالت های مجاوربا استفاده از تقریبگرهای عمومی یکی از راهکارهایی است که برای حل این مسئله پیشنهادشده است. در این روش عامل مجموعه ای محدود از فضای حالت را تجربه می کند و از طریق تعمیم دهی تقریب خوبی از کل فضا را بدست می آورد. یکی از بهترین تقریبگرهای عمومیسیستم های فازی اند. د...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - پژوهشکده فنی و مهندسی 1391

در طی دو- سه دهه ی اخیر صنعت برق در سرتاسر جهان، گذار از ساختارهای یک پارچه ی عمودی را به سمت بازارهای آزاد رقابتی آغاز کرده است. با وجود حرکت به سمت فضای رقابتی، متأسفانه این گذار به صورت کامل صورت نگرفته است، و بازارهایی با رقابت ناکامل ایجاد شده اند. در بازاری با رقابت ناکامل، تولید کننده گان درمی یابند که اگر قیمتی بالاتر از هزینه ی حدی شان پیشنهاد دهند ممکن است سود بیشتری به دست آورند. بنا...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388

بازار برق به عنوان یک سیستم اقتصادی که با انسان و رفتارهای غیرخطی او دست به گریبان است و همچنین با توجه به دینامیک، قیود فیزیکی و پیچیدگی های سیستم قدرت، همواره مورد توجه محققان بوده است. برای حل مسائل پیچیده استفاده از سیستم های هوشمند که قابلیت ترکیب روش های یادگیری و دانش های مختلف از منابع متفاوت را دارند ضروری است. از جمله سیستم های هوشمند می توان به شبکه های عصبی مصنوعی، الگوریتم ژنتیک، ا...

چکیده – امروزه بدلیل افزایش ارتباطات بی سیم و لزوم بهره برداری از آن در مناطق مختلف، برپایی و استفاده از شبکه های رایانه ای بی سیم رشد فراوانی داشته است. در این راستا شبکه های سیار موردی نیز به لحاظ داشتن مزایایی چون عدم نیاز به زیر ساخت از پیش تعیین شده، مدیریت مرکزی و نیز تحرک و انعطاف پذیری بالا مورد توجه فراوان قرار گرفته است. از موارد مهم در این گونه شبکه ها موضوع مسیریابی و برقراری ارتباط...

ژورنال: کنترل 2014

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

hiv ویروسی است که با مختل کردن عملکرد و از بین بردن نوع خاصی از سلول های ایمنی بدن به نام t-cd4 منجر به نقص دستگاه ایمنی بدن انسان می شود. این ویروس با از بین بردن این گونه از سلول ها، باعث ایجاد بیماری ایدز (نقص ایمنی اکتسابی) می شود. امروزه پیشرفت های قابل توجهی در داروهای مورد استفاده در درمان بیماران مبتلا به عفونت hiv پدیدار گشته است که سبب بهبود کیفیت زندگی و افزایش طول عمر بیماران شده اس...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید