نتایج جستجو برای: الگوریتم آتوماتای یادگیری تقویتی
تعداد نتایج: 41364 فیلتر نتایج به سال:
این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی...
در یادگیری تیمی و هنگامی که مجموعه ای از عامل ها در کنار یکدیگر به یادگیری می پردازند، زمانی می توان یادگیری مناسبی داشت که در آن میزان کارایی هر عامل مشخص باشد و بتوان نقش عاملهای مختلف را به دستی در تیم تعییین کرد. در این صورت می توان براساس نقش و میزان تاثیرگذاری عامل در کار گروهی تیم به وی امتیاز داد. در تحقیقاتی که تاکنون انجام شده است نقش همه عاملهای شرکت کننده در یادگیری را یکسان فرض کرد...
ساختار رقابت مابین تأمین کنندگان انرژی در بخش تولید بازارهای برق منجر به آن شده است که شرکت های تولید با اتخاذ تصمیمات استراتژیک به دنبال حداکثرسازی سودشان باشند. در این راستا، شرکت های تولید سعی می کنند که از طریق ارائه قیمتی مناسب در سطحی بالاتر از هزینه های حدی خود، در رقابت با سایر تولیدکنندگان سهم بیش تری از تأمین انرژی الکتریکی بازار برق را کسب نمایند. هدف این مقاله پیشنهاد یک روش مبتنی ب...
ساختار رقابت مابین تأمینکنندگان انرژی در بخش تولید بازارهای برق منجر به آن شده است که شرکتهای تولید با اتخاذ تصمیمات استراتژیک بهدنبال حداکثرسازی سودشان باشند. در این راستا، شرکتهای تولید سعی میکنند که از طریق ارائه قیمتی مناسب در سطحی بالاتر از هزینههای حدی خود، در رقابت با سایر تولیدکنندگان سهم بیشتری از تأمین انرژی الکتریکی بازار برق را کسب نمایند. هدف این مقاله پیشنهاد یک روش مبتنی ب...
شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان ا...
تعیین دوز دارو در درمان سرطان از نظر میزان هزینه و نیز صدمات جانبی وارد شده بر بیماران بسیار حائز اهمیت است و لذا پزشکان در تعیین برنامه دارویی روزانه بیماران، سعی می کنند میزان داروی تجویز شده در یک محدوده مشخص باشد و در ضمن مجموع داروی تزریق شده به بیماران در یک دوره زمانی نیز تا حد ممکن کاهش یابد. در این تحقیق الگوریتم یادگیری تقویتی فازی به عنوان یک روش جدید در تعیین دوز دارو جهت درمان یکی ...
چالش اصلی در غالب موتورهای جستجو، رتبه بندی اسناد بازیابی شده برای ارائه بهترین پاسخ به پرس و جوی کاربران است. در این پایان نامه با فرموله کردن این مسئله با استفاده از مفاهیم یادگیری تقویتی، دو الگوریتم جدید رتبه بندی مبتنی بر اتصال با عناوین rl_rank و rurl ارائه شده است. یادگیری تقویتی یک تکنیک قویِ هوش مصنوعی است که حول جایزه گذر بین حالت ها و تابع ارزش، عمل می کند. در الگوریتم rl_rank، هر صفح...
توسعه کنترلر هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک
افزایش روزافزون تعداد خودروها و در پی آن ترافیکهای سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را بهخوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغهای راهنمایی بر پایه یادگیری تقو...
طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...
امروزه یکی از چالش های اصلی شبکه های ترافیکی، هدایت وسائل نقلیه برای رسیدن به مقصدشان تحت وضعیت پویای ترافیک با هدف اجتناب از تراکم، کاهش زمانهای سفر و استفاده موثرتر از ظرفیتهای موجود شبکه حمل ونقل شهری می باشد. در پاسخ به مسائل بیان شده، سیستم پویای هدایت(راهنمای) مسیر رویکردی موثر به نظر می رسد. این سیستم از جمله حوزه های مهم فعالیت سیستمهای هوشمند حمل ونقل(its) می باشد. هسته اصلی سیستم پو...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید