نتایج جستجو برای: الگوریتم آتوماتای یادگیری تقویتی
تعداد نتایج: 41364 فیلتر نتایج به سال:
هدف: شکاف بین زمان دریافت سیگنال خرید/ فروش و آغاز روند تغییر قیمت در بازارهای نوظهور، بستر مناسبی برای پیادهسازی سیستمهای معاملات الگوریتمی ایجاد میکند. ارائه یک سیستم معاملاتی با تکرار زیاد، مزایا (استفاده از نوسانهای درونروزی) و معایبی (هزینه زیاد معاملاتی) دارد که با طراحی درست آن و اصلاح مقررات معامله، میتوان مزایای آن را افزایش داد و معایبش را کنترل کرد. روش: در این پژوهش، به ارائه...
گرید محاسباتی یک سیستم موازی و توزیع شده می باشد که هماهنگ سازی و اشتراک منابع را در مقیاس بزرگ امکان پذیر می سازد. مالکان منابع با انگیزه های مالی، منابع خود را در اختیار دیگران قرار می دهند. مشتریان گرید نیز با پرداخت هزینه ی درخواست خود، می توانند از این منابع استفاده کنند. برای مدیریت چنین سیستم های پیچیده ای، نمی توان از رویکردهای متداول مدیریت منابع، که سعی می کنند کارایی را در کل سیستم ب...
مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...
تحقیقات نشان داده است که طراحی فعالیتهای توانبخشی در قالب بازیهای جدی میتواند منجر به انگیزش بیشتر در بیماران شود. درجه سختی چنین بازیهایی معمولاً بهصورت دستی توسط درمانگر تنظیم میشود. این در حالی است که بازیهای توانبخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارتهای بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازیهای توانبخشی ارائه میکند که در آن سختی بازی بهصورت ...
امروزه رتبه بندی مبتنی بر یادگیری به مبحث تحقیقاتی مهمی در زمینه ی بازیابی اطلاعات تبدیل شده است. در حقیقت یک داستان یکسان برای روش های رتبه بندی اتفاق می افتد. در این داستان، هدف فراهم کردن مدل رتبه بندی بر طبق ارتباط بین اسناد و پرس وجو است که اسناد را به عنوان ورودی دریافت کند و لیست اسناد را بر حسب میزان مرتبط بودنشان به پرس وجوی کاربر مرتب کند. در این پایان نامه، سه الگوریتم رتبه بندی مبتن...
در سالیان اخیر با پیشرفت ابزارهای آزمایشگاهی و فن آوریهای نوین، شواهد تجربی یادگیری تقویتی و با سرپرستی که بعنوان تئوریهای پایه ای در علم یادگیری و کنترل حرکات ارادی شناخته می شوند، در حال ارائه هستند. در پایان نامه حاضر تلاش در جهت رسیدن به شناختی جامع از سیستم، جهت یادگیری کنترل حرکات با عنایت به یادگیری تقویتی و نیز یادگیری با سرپرستی بصورت مدل معکوس و نقش آنها در حفظ موقعیت و حرکت به انجام ...
ترکیب طبقهبندها، یک روش مؤثر در یادگیری ماشینی است که در آن با ترکیب نتایج چند طبقهبند سعی میگردد تقریب بهتری از یک طبقهبند بهینه فراهم شود. برای آنکه ترکیب نتایج طبقهبندها مفید واقع شود باید طبقهبندهای پایه ضمن برخورداری از کارایی قابل قبول، دارای خطاهای متفاوتی باشند. همچنین بایستی قاعده مناسبی برای ترکیب خروجی طبقهبندهای پایه به کار گرفته شود. روشهای متعدد ترکیب طبقهبندها ارائه شده ...
در طول سالیان گذشته ، تلاشهای زیادی در زمینه بهره برداری از یادگیری تقویتی به عنوان ابزار هوش مصنوعی و کنترل هوشمند صورت پذیرفته است و بر اثر موفقیت تحقیقاتی کاربرد یادگیری تقویتی در سیستم های کنترلی پردازشی ، تعداد زیادی از تحقیقات انجام یافته در دو دهه گذشته یادگیری عاطفی هم در سالهای اخیر دراین نوع کاربردها به طور موفقیت آمیز بکار برده شده است. هنگام تصمیم گیری در مورد چگونگی استفاده از سیگن...
آونگ وارونه مسأله ای کلاسیک در زمینه تئوری کنترل و دینامیک است و به طور گسترده به-عنوان معیاری برای تست الگوریتم های کنترل به کار می رود. مشکل اصلی کنترل آونگ وارونه، کنترل آنلاین این سیستم تحت شرایط متغیر محیطی و امکان تطبیق پذیری هر چه بهتر این سیستم با محیط است. از این رو روش های یادگیری تقویتی گزینه مناسبی برای رفع این گونه چالش ها به حساب می آید. یکی از موانع اصلی دربرابر سرعت و دقّت یادگیر...
در این پایان نامه از یادگیری تقویتی برای پیدا کردن یک سیاست مناسب جهت رفع مشکل موجود در بازی های امروزی که سطح سختی نامتناسب و عدم تطبیق پذیری بازی، با قابلیت های بازیکنان می باشد استفاده کرده-ایم. عامل یادگیرنده بازی که از روش یادگیری تطبیقی dyna بهره می برد با بکار بردن تابع عمل-ارزش و دریافت پاداش، شروع به درک محیط اطراف خود می کند و در ادامه، مبحث انتخاب و سازماندهی ویژگی ها، اعمال و پاداش ...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید