نتایج جستجو برای: الگوریتم آتوماتای یادگیری تقویتی

تعداد نتایج: 41364  

ژورنال: تحقیقات مالی 2018

هدف: شکاف بین زمان دریافت سیگنال خرید/ فروش و آغاز روند تغییر قیمت در بازارهای نوظهور، بستر مناسبی برای پیاده‎سازی سیستم‎های معاملات الگوریتمی ایجاد می‎کند. ارائه یک سیستم معاملاتی با تکرار زیاد، مزایا (استفاده از نوسان‎های درون‎روزی) و معایبی (هزینه زیاد معاملاتی) دارد که با طراحی درست آن و اصلاح مقررات معامله، می‎توان مزایای آن را افزایش داد و معایبش را کنترل کرد. روش: در این پژوهش، به ارائه...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - پژوهشکده برق و کامپیوتر 1392

گرید محاسباتی یک سیستم موازی و توزیع شده می باشد که هماهنگ سازی و اشتراک منابع را در مقیاس بزرگ امکان پذیر می سازد. مالکان منابع با انگیزه های مالی، منابع خود را در اختیار دیگران قرار می دهند. مشتریان گرید نیز با پرداخت هزینه ی درخواست خود، می توانند از این منابع استفاده کنند. برای مدیریت چنین سیستم های پیچیده ای، نمی توان از رویکردهای متداول مدیریت منابع، که سعی می کنند کارایی را در کل سیستم ب...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1394

مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...

تحقیقات نشان داده است که طراحی فعالیت‌های توان‌بخشی در قالب بازی‌های جدی می‌تواند منجر به انگیزش بیش‌تر در بیماران شود. درجه سختی چنین بازی‌هایی معمولاً به‌صورت دستی توسط درمانگر تنظیم می‌شود. این در حالی است که بازی‌های توان‌بخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارت‌های بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازی‌های توان‌بخشی ارائه می‌کند که در آن سختی بازی به‌صورت ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه علم و هنر - دانشکده فنی 1393

امروزه رتبه بندی مبتنی بر یادگیری به مبحث تحقیقاتی مهمی در زمینه ی بازیابی اطلاعات تبدیل شده است. در حقیقت یک داستان یکسان برای روش های رتبه بندی اتفاق می افتد. در این داستان، هدف فراهم کردن مدل رتبه بندی بر طبق ارتباط بین اسناد و پرس وجو است که اسناد را به عنوان ورودی دریافت کند و لیست اسناد را بر حسب میزان مرتبط بودنشان به پرس وجوی کاربر مرتب کند. در این پایان نامه، سه الگوریتم رتبه بندی مبتن...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی 1387

در سالیان اخیر با پیشرفت ابزارهای آزمایشگاهی و فن آوریهای نوین، شواهد تجربی یادگیری تقویتی و با سرپرستی که بعنوان تئوریهای پایه ای در علم یادگیری و کنترل حرکات ارادی شناخته می شوند، در حال ارائه هستند. در پایان نامه حاضر تلاش در جهت رسیدن به شناختی جامع از سیستم، جهت یادگیری کنترل حرکات با عنایت به یادگیری تقویتی و نیز یادگیری با سرپرستی بصورت مدل معکوس و نقش آنها در حفظ موقعیت و حرکت به انجام ...

ترکیب طبقه‌بندها، یک روش مؤثر در یادگیری ماشینی است که در آن با ترکیب نتایج چند طبقه‌بند سعی می‌گردد تقریب بهتری از یک طبقه‌بند بهینه فراهم شود. برای آنکه ترکیب نتایج طبقه‌بندها مفید واقع شود باید طبقه‌بندهای پایه ضمن برخورداری از کارایی قابل قبول، دارای خطاهای متفاوتی باشند. همچنین بایستی قاعده مناسبی برای ترکیب خروجی طبقه‌بندهای پایه به کار گرفته شود. روش‌های متعدد ترکیب طبقه‌بندها ارائه شده ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تهران 1381

در طول سالیان گذشته ، تلاشهای زیادی در زمینه بهره برداری از یادگیری تقویتی به عنوان ابزار هوش مصنوعی و کنترل هوشمند صورت پذیرفته است و بر اثر موفقیت تحقیقاتی کاربرد یادگیری تقویتی در سیستم های کنترلی پردازشی ، تعداد زیادی از تحقیقات انجام یافته در دو دهه گذشته یادگیری عاطفی هم در سالهای اخیر دراین نوع کاربردها به طور موفقیت آمیز بکار برده شده است. هنگام تصمیم گیری در مورد چگونگی استفاده از سیگن...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

آونگ وارونه مسأله ای کلاسیک در زمینه تئوری کنترل و دینامیک است و به طور گسترده به-عنوان معیاری برای تست الگوریتم های کنترل به کار می رود. مشکل اصلی کنترل آونگ وارونه، کنترل آنلاین این سیستم تحت شرایط متغیر محیطی و امکان تطبیق پذیری هر چه بهتر این سیستم با محیط است. از این رو روش های یادگیری تقویتی گزینه مناسبی برای رفع این گونه چالش ها به حساب می آید. یکی از موانع اصلی دربرابر سرعت و دقّت یادگیر...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1392

در این پایان نامه از یادگیری تقویتی برای پیدا کردن یک سیاست مناسب جهت رفع مشکل موجود در بازی های امروزی که سطح سختی نامتناسب و عدم تطبیق پذیری بازی، با قابلیت های بازیکنان می باشد استفاده کرده-ایم. عامل یادگیرنده بازی که از روش یادگیری تطبیقی dyna بهره می برد با بکار بردن تابع عمل-ارزش و دریافت پاداش، شروع به درک محیط اطراف خود می کند و در ادامه، مبحث انتخاب و سازماندهی ویژگی ها، اعمال و پاداش ...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید