نتایج جستجو برای: یادگیری q

تعداد نتایج: 141956  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

روش ترکیبی q-فازی به عنوان یک روش جدید در پایدار سازی غلظت قند خون در این تحقیق مورد استفاده قرار گرفته است. ایده ی اصلی بکارگیری این روش افزایش رباستنس کنترلر طراحی شده در برابر عدم قطعیت های موجود در پارامترهای مدل می باشد. این روش از ترکیب دو روش یادگیری تقویتی و سیستم های فازی که بر روی فضاهای پیوسته تعریف می شوند، به منظور پایدار سازی غلظت قند خون در بازه ی نرمال استفاده می کند. کنترلر طرا...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393

در این پایان نامه مسئله استراتژی قیمت¬دهی تولیدکنندگان انرژی در بازار یکنواخت برق برای رسیدن به حداکثر سود بررسی شده است. فروشندگان انرژی پیشنهادات قیمت خود را با بهره گیری از سه الگوریتم متفاوت q-learning، r-learning و sarsa برای یک ساعت مشخص از شبانه روز به اپراتور سیستم اعلام می کنند. الگوریتم های یادگیری تقویتی ذکر شده با روش انتخاب عمل تبرید تدریجی، ترکیب شده اند. سود بدست آمده برای فروشند...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1386

شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان ا...

Journal: : 2022

هدف: به‌کارگیری فناوری رایانش ابری، روند جدیدی در جهان امروز می‌باشد. ابری یکی از فناوری‌های اطلاعاتی نسل جدید است که روز به بیشتر کشورها محبوبیت بیشتری پیدا می‌کند. سال‌های اخیر سازمان‌ها شروع انتخاب مدل‌های خود می‌کنند. مؤسسات آموزشی، به‌ویژه دانشگاه‌ها و مدارس، نمی‌توانند مزایای قابل توجهی را برای آن‌ها همراه دارد، نادیده بگیرند با توجه رو رشد استفاده آن غفلت نمایند. هدف اصلی این پژوهش شناسا...

امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیب‌های مختلف اقتصادی، محیط زیستی و اجتماعی می‌شود. برای جلوگیری از این آسیب‌ها، نیاز به بهبود زیر ساخت‌های فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس می‌شود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغ‌های راهنمایی به عنوان یکی از شاخه‌های سیستم‌های حمل و نقل هوشمند با استفاده از سامانه‌های چند عامله یادگی...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

آونگ وارونه مسأله ای کلاسیک در زمینه تئوری کنترل و دینامیک است و به طور گسترده به-عنوان معیاری برای تست الگوریتم های کنترل به کار می رود. مشکل اصلی کنترل آونگ وارونه، کنترل آنلاین این سیستم تحت شرایط متغیر محیطی و امکان تطبیق پذیری هر چه بهتر این سیستم با محیط است. از این رو روش های یادگیری تقویتی گزینه مناسبی برای رفع این گونه چالش ها به حساب می آید. یکی از موانع اصلی دربرابر سرعت و دقّت یادگیر...

Journal: : 2022

هدف اصلی این پژوهش ارائه چارچوبی برای ارزیابی عملکرد شرکت بهره‌­برداری قطار شهری مشهد بر مبنای کارت امتیازی متوازن و تکنیک تصمیم‌­گیری چندمعیاره (بهترین ـ بدترین فازی) است. حاضر از نظر هدف، کاربردی روش، کمّی اسنادی جمع‌­آوری داده‌های کیفی اساس 15 خبره در طی مقطع زمانی بین سال­‌های 1396 تا 1398 صورت پذیرفت. 9 معیار منظر مالی، 16 مشتریان، 8 فرایند داخلی 14 رشد توسعه یادگیری طریق اسناد پژوهش­‌های پ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشکده علوم اقتصادی - دانشکده اقتصاد 1392

چالش بزرگ مدیریت سفارش دهی در زنجیره تأمین اتخاذ یک راهبرد سفارش دهی مناسب در هر رده از زنجیره تأمین برای کاهش هزینه انبار و در نتیجه کاهش هزینه ها در زنجیره تأمین است. در این پایان نامه عامل های هوشمند نرم افزاری وظیفه تصمیم گیری پویا را برای پیدا کردن یک راهبرد مناسب سفارش دهی بر عهده می گیرند. در گام اول ما به سراغ الگوریتم یادگیری q می رویم و ضمن نشان دادن برتری آن نسبت به الگوریتم هایی که ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392

یادگیری تقویتی به طور گسترده و موفقیت آمیزی برای حل مسائل کنترل بهینه تنظیم سیستم های دارای دینامیک نا معین بکار گرفته شده است. با این حال، به دلیل اینکه در روش های موجود حل مسئله ردیابی بهینه، برای بدست آوردن قسمت پیشرو ورودی کنترلی دینامیک کامل سیستم نیاز هست، روش های یادگیری تقویتی به طور مستقیم قابل اعمال برای مسئله ردیابی بهینه سیستم های دارای دینامیک نامعین نمی باشند. در این پایان نامه رو...

ژورنال: :مهندسی برق دانشگاه تبریز 0
عادل اکبری مجد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حسین شایقی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حمید محمدنژاد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق عبداله یونسی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید