نتایج جستجو برای: الگوریتم آتوماتای یادگیری تقویتی

تعداد نتایج: 41364  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد 1388

آتوماتای سلولی مدل ساده ای از محاسبات ریاضی است که به ظاهر رفتار پیچیده ای از خود نشان می دهند و می توانند برای محاسبات و شبیه سازی سیستم ها به کار روند‎.‎ مسیر یابی به مسأله ی هندسی‎ِ‎ تعیین‎ِ‎ دنباله ای از موقعیت ها و جهات ربات اشاره می کند که ربات بین موقعیت های مبدأ و مقصد تا زمانی که تصادمی نداشته باشد حرکت کند‎.‎ در این رساله‎،‎ یک الگوریتم مسیریابی برای یک ربات روی آتوماتای سلولی چند لا...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388

بازار برق به عنوان یک سیستم اقتصادی که با انسان و رفتارهای غیرخطی او دست به گریبان است و همچنین با توجه به دینامیک، قیود فیزیکی و پیچیدگی های سیستم قدرت، همواره مورد توجه محققان بوده است. برای حل مسائل پیچیده استفاده از سیستم های هوشمند که قابلیت ترکیب روش های یادگیری و دانش های مختلف از منابع متفاوت را دارند ضروری است. از جمله سیستم های هوشمند می توان به شبکه های عصبی مصنوعی، الگوریتم ژنتیک، ا...

چکیده – امروزه بدلیل افزایش ارتباطات بی سیم و لزوم بهره برداری از آن در مناطق مختلف، برپایی و استفاده از شبکه های رایانه ای بی سیم رشد فراوانی داشته است. در این راستا شبکه های سیار موردی نیز به لحاظ داشتن مزایایی چون عدم نیاز به زیر ساخت از پیش تعیین شده، مدیریت مرکزی و نیز تحرک و انعطاف پذیری بالا مورد توجه فراوان قرار گرفته است. از موارد مهم در این گونه شبکه ها موضوع مسیریابی و برقراری ارتباط...

ژورنال: کنترل 2014

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

hiv ویروسی است که با مختل کردن عملکرد و از بین بردن نوع خاصی از سلول های ایمنی بدن به نام t-cd4 منجر به نقص دستگاه ایمنی بدن انسان می شود. این ویروس با از بین بردن این گونه از سلول ها، باعث ایجاد بیماری ایدز (نقص ایمنی اکتسابی) می شود. امروزه پیشرفت های قابل توجهی در داروهای مورد استفاده در درمان بیماران مبتلا به عفونت hiv پدیدار گشته است که سبب بهبود کیفیت زندگی و افزایش طول عمر بیماران شده اس...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393

یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که هدف آن بهبود رفتار عامل بر اساس سیگنال های تقویتی است که از محیط دریافت می کند. مشکل اینجاست که در بسیاری از کاربردهای واقعی، پاداش محیط با تاخیر بسیار زیادی به عامل داده می شود. مشکل دیگر این است که تا زمانی که عامل به یک سطح قابل قبول از یادگیری برسد، تمام حرکات آن تصادفی خواهد بود. ضمناً با پیچیده تر شدن محیط، تعداد وضعیت های مورد اکتشاف و پ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان 1390

یک شبکه حسگر بی سیم شبکه ای است شامل صدها گره حسگر که به صورت تصادفی و یا به طور دستی در یک محدوده جغرافیایی پخش شده اند. گره های حسگر در تعامل با یکدیگر به نظارت بر شرایط فیزیکی و محیطی منطقه تحت پوشش خود مشغول بوده و اطلاعات دریافتی توسط هر گره به کمک گره های دیگر در کل شبکه منتشر می شود. یکی از مسائل چالش بر انگیز در رابطه با شبکه های حسگر بی سیم مسئله مسیریابی اطلاعات است؛ از آنجاییکه گره ه...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان 1388

امروزه کنترل فرکانس-بار در سیستمهای قدرت بخصوص در شبکه¬های قدرت به هم پیوسته که از توربینهای بادی استفاده می¬کنند، به یک موضوع مهم تبدیل شده است. درعمل سیستمهای کنترل فرکانس-بار از کنترلرهای انتگرال¬گیر تناسبی استفاده می¬کنند. اما این کنترلرها براساس یک مدل خطی طراحی شده¬اند، مشخصات غیرخطی سیستم را در نظر نمی-گیرند و قادر به تولید بهره دینامیکی بالا برای بخش وسیعی از شرایط کاری در سیستمهای قدرت...

ژورنال: :مکانیک سازه ها و شاره ها 2013
بهروز رئیسی شاپور گلبهار حقیقی علی اکبر صفوی

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر 1390

سیستم های چندعامله ((mas راه حلی برای مسائل مطرح شده امروزه است که ویژگی هایی مانند توزیع شدگی، پویایی ، تطبیق پذیری، تنومندی، کارایی و قابلیت استفاده مجدد را فراهم می کند. از آنجا که محیط معمولا به اندازه کافی هوشمند نیست تا عاملهای انفرادی را در یک تیم همکارانه تشخیص صلاحیت دهد و سیگنال تقویتی اسکالر منفرد، تنها بازخورد قابل اطمینان است که تیم عامل های یادگیر دریافت می کند، انتساب امتیاز بی...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید