یادگیری q

کنترل سطح گلوکز خون در بیماران دیابتی نوع 1 با استفاده از الگوریتم q- فازی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

زهره اصغری, محمد باقر نقیبی سیستانی,

روش ترکیبی q-فازی به عنوان یک روش جدید در پایدار سازی غلظت قند خون در این تحقیق مورد استفاده قرار گرفته است. ایده ی اصلی بکارگیری این روش افزایش رباستنس کنترلر طراحی شده در برابر عدم قطعیت های موجود در پارامترهای مدل می باشد. این روش از ترکیب دو روش یادگیری تقویتی و سیستم های فازی که بر روی فضاهای پیوسته تعریف می شوند، به منظور پایدار سازی غلظت قند خون در بازه ی نرمال استفاده می کند. کنترلر طرا...

پیشنهاد استراتژی قیمت دهی فروشندگان انرژی بازار برق با کمک الگوریتم های یادگیری تقویتی مبتنی بر تبرید تدریجی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393

غزاله محسنی راد, محمد باقر نقیبی سیستانی,

در این پایان نامه مسئله استراتژی قیمت¬دهی تولیدکنندگان انرژی در بازار یکنواخت برق برای رسیدن به حداکثر سود بررسی شده است. فروشندگان انرژی پیشنهادات قیمت خود را با بهره گیری از سه الگوریتم متفاوت q-learning، r-learning و sarsa برای یک ساعت مشخص از شبانه روز به اپراتور سیستم اعلام می کنند. الگوریتم های یادگیری تقویتی ذکر شده با روش انتخاب عمل تبرید تدریجی، ترکیب شده اند. سود بدست آمده برای فروشند...

به کارگیری روش یادگیری تقویتی برای مسیریابی پویا در شبکه به عنوان یک سیستم چند عاملی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1386

سعید مجیدی, مسعودرضا هاشمی, مازیار پالهنگ,

شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان ا...

15 صفحه اول

Factors Affecting the Use of Cloud Computing in High School Education

Journal: : 2022

هدف: به‌کارگیری فناوری رایانش ابری، روند جدیدی در جهان امروز می‌باشد. ابری یکی از فناوری‌های اطلاعاتی نسل جدید است که روز به بیشتر کشورها محبوبیت بیشتری پیدا می‌کند. سال‌های اخیر سازمان‌ها شروع انتخاب مدل‌های خود می‌کنند. مؤسسات آموزشی، به‌ویژه دانشگاه‌ها و مدارس، نمی‌توانند مزایای قابل توجهی را برای آن‌ها همراه دارد، نادیده بگیرند با توجه رو رشد استفاده آن غفلت نمایند. هدف اصلی این پژوهش شناسا...

متن کامل

توسعه سامانه‌های چند عامله و یادگیری تقویتی در کنترل هوشمند چراغ‌های راهنمایی

ژورنال: علوم و فنون نقشه برداری 2017

اصلانی, محمد, مسگری, محمد سعدی,

امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیب‌های مختلف اقتصادی، محیط زیستی و اجتماعی می‌شود. برای جلوگیری از این آسیب‌ها، نیاز به بهبود زیر ساخت‌های فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس می‌شود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغ‌های راهنمایی به عنوان یکی از شاخه‌های سیستم‌های حمل و نقل هوشمند با استفاده از سامانه‌های چند عامله یادگی...

متن کامل

حل مسأله سیستم آونگ وارونه به روش یادگیری q فازی نوع ii فاصله ای

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

سید مرتضی هاشمیان, رضا منصفی,

آونگ وارونه مسأله ای کلاسیک در زمینه تئوری کنترل و دینامیک است و به طور گسترده به-عنوان معیاری برای تست الگوریتم های کنترل به کار می رود. مشکل اصلی کنترل آونگ وارونه، کنترل آنلاین این سیستم تحت شرایط متغیر محیطی و امکان تطبیق پذیری هر چه بهتر این سیستم با محیط است. از این رو روش های یادگیری تقویتی گزینه مناسبی برای رفع این گونه چالش ها به حساب می آید. یکی از موانع اصلی دربرابر سرعت و دقّت یادگیر...

15 صفحه اول

Performance Evaluation with a Combination of Balanced Scorecard Model and the Fuzzy Best-Worst Method (Case Study: Mashhad City Train Operation Company)

Journal: : 2022

هدف اصلی این پژوهش ارائه چارچوبی برای ارزیابی عملکرد شرکت بهره‌برداری قطار شهری مشهد بر مبنای کارت امتیازی متوازن و تکنیک تصمیم‌گیری چندمعیاره (بهترین ـ بدترین فازی) است. حاضر از نظر هدف، کاربردی روش، کمّی اسنادی جمع‌آوری داده‌های کیفی اساس 15 خبره در طی مقطع زمانی بین سال‌های 1396 تا 1398 صورت پذیرفت. 9 معیار منظر مالی، 16 مشتریان، 8 فرایند داخلی 14 رشد توسعه یادگیری طریق اسناد پژوهش‌های پ...

متن کامل

کنترل هوشمند موجودی در زنجیره تأمین مبتنی بر سیستم های چند عامله

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشکده علوم اقتصادی - دانشکده اقتصاد 1392

احمدرضا ناظمی سجزیی, امیررضا ابطحی, کاوه خلیلی دامغانی,

چالش بزرگ مدیریت سفارش دهی در زنجیره تأمین اتخاذ یک راهبرد سفارش دهی مناسب در هر رده از زنجیره تأمین برای کاهش هزینه انبار و در نتیجه کاهش هزینه ها در زنجیره تأمین است. در این پایان نامه عامل های هوشمند نرم افزاری وظیفه تصمیم گیری پویا را برای پیدا کردن یک راهبرد مناسب سفارش دهی بر عهده می گیرند. در گام اول ما به سراغ الگوریتم یادگیری q می رویم و ضمن نشان دادن برتری آن نسبت به الگوریتم هایی که ...

حل مسئله ردیابی بهینه سیستم های دینامیکی زمان-گسسته خطی با دینامیک نامعین به کمک یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392

بهاره کیومرثی خمارتاش, علی کریم پور, محمد باقر نقیبی سیستانی,

یادگیری تقویتی به طور گسترده و موفقیت آمیزی برای حل مسائل کنترل بهینه تنظیم سیستم های دارای دینامیک نا معین بکار گرفته شده است. با این حال، به دلیل اینکه در روش های موجود حل مسئله ردیابی بهینه، برای بدست آوردن قسمت پیشرو ورودی کنترلی دینامیک کامل سیستم نیاز هست، روش های یادگیری تقویتی به طور مستقیم قابل اعمال برای مسئله ردیابی بهینه سیستم های دارای دینامیک نامعین نمی باشند. در این پایان نامه رو...

کنترل کننده مقاوم تطبیقی بار فرکانس مبتنی بر یادگیری تقویتی برای یک سیستم قدرت به هم پیوسته شامل smes

ژورنال: :مهندسی برق دانشگاه تبریز 0

عادل اکبری مجد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حسین شایقی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حمید محمدنژاد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق عبداله یونسی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...

متن کامل