تولید قواعد فازی احتمالی بهکمک یادگیری تقویتی
Authors
Abstract:
مهمترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با دادههای آموزشی، وجود دادههای ناسازگار است زیرا در اینگونه دادهها چند خروجی برای وضعیتهای یکسان وجود دارد. لذا تولید قواعد و تصمیمگیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روشهای موجود از برآیند حالتهای ناسازگار استفاده میکنند که باعث تولید خروجی با مقدار میانگین تالیهای مربوطه میشود. بهمنظور بهبود این مشکل در این مقاله از مقداردهی اولیه بهمقدار احتمال انتخاب عملها، در یادگیری تقویتی فازی مبتنی بر معماری عملگر-نقاد استفاده میشود. با خوشهبندی داده آموزشی و استفاده از مدل سوگنوی مرتبه صفر با تعدادی عمل کاندید در هر قاعده، پارامترهای ماژول عملگر مقداردهی اولیه شده و درنهایت با معماری عملگر-نقاد و سیگنال تقویتی، بهصورت برخط تنظیم میشوند. با توجه به اینکه مشکل ناسازگاری در دادههای مربوط به ناوبری ربات نسبت به موارد دیگر نمایانتر است، ایده ارائهشده در مسئله ناوبری ربات استفاده میشود. آزمایشها در شبیهساز Webots برای ربات ایپاک انجام شده است. نتایج آزمایشها حاکی از آن است که روش ارائهشده موجب کاهش زمان یادگیری، کاهش برخورد به موانع در مسئله ناوبری ربات با قواعد فازی کمتر است.
similar resources
یک روش ترکیبی جدید یادگیری تقویتی فازی
در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه میشود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته میشود. هدف، یافتن مناسبترین عمل نامزد (تالی) برای هر قاعده میباشد. با استفاده از بردار شدت آتش قواعد فازی و ...
full textارزیابی تکنولوژیهای پیشرفته تولید با استفاده از مدل ترکیبی برنامهریزی احتمالی و تصمیمگیری چند معیاره فازی
The competition enhancement and demand increases have directed many producers to employ advanced manufacturing technologies. For this purpose, the selection of best alternative among various manufacturing technologies is the topic of high importance. Many articles have discussed the insufficiency of general financial measures for investment justification in advanced manufacturing technologies...
full textروشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
full textروش یادگیری q-فازی در ترکیب با روش های بهینه سازی برای کنترل فازی تقویتی
طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...
15 صفحه اولطراحی و تولید قواعد بهینه فازی در تشخیص نفوذ
با توجه به استفاده وسیع از سیستم ها و شبکه های کامپیوتری، تعداد حملات به شیوه های مختلف، به آنها نیز در حال افزایش است و همه روزه خیلی روش های جدید و ابزارهای هک و نفوذ بوجود می آیند. استفاده از سیستم تشخیص نفوذ یکی از روشهای تشخیص فعالیت های مشکوک در شبکه است. یک سیستم تشخیص نفوذ، همه فعالیت های شبکه را مونیتور می کند و تصمیم می گیرد که آیا فعالیتی مشکوک است یا نرمال. سیستم تشخیص نفوذ، اطلاعات...
15 صفحه اولتوسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله
در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...
15 صفحه اولMy Resources
Journal title
volume 47 issue 4
pages 1669- 1676
publication date 2018-02-20
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023