الگوریتم آتوماتای یادگیری تقویتی

ارائه مدل معاملاتی با فراوانی زیاد، همراه با مدیریت پویای سبد سهام به روش یادگیری تقویتی در بورس اوراق بهادار تهران

ژورنال: تحقیقات مالی 2018

محسن دستپاک, محمد علی رستگار,

هدف: شکاف بین زمان دریافت سیگنال خرید/ فروش و آغاز روند تغییر قیمت در بازارهای نوظهور، بستر مناسبی برای پیاده‎سازی سیستم‎های معاملات الگوریتمی ایجاد می‎کند. ارائه یک سیستم معاملاتی با تکرار زیاد، مزایا (استفاده از نوسان‎های درون‎روزی) و معایبی (هزینه زیاد معاملاتی) دارد که با طراحی درست آن و اصلاح مقررات معامله، می‎توان مزایای آن را افزایش داد و معایبش را کنترل کرد. روش: در این پژوهش، به ارائه...

متن کامل

روشی جهت کشف منابع در شبکه گرید با استفاده از q-learinig

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - پژوهشکده برق و کامپیوتر 1392

اصغر پشوتن, حسن ختن لو, احمد فراهی,

گرید محاسباتی یک سیستم موازی و توزیع شده می باشد که هماهنگ سازی و اشتراک منابع را در مقیاس بزرگ امکان پذیر می سازد. مالکان منابع با انگیزه های مالی، منابع خود را در اختیار دیگران قرار می دهند. مشتریان گرید نیز با پرداخت هزینه ی درخواست خود، می توانند از این منابع استفاده کنند. برای مدیریت چنین سیستم های پیچیده ای، نمی توان از رویکردهای متداول مدیریت منابع، که سعی می کنند کارایی را در کل سیستم ب...

15 صفحه اول

یادگیری تقویتی برای ربات های فوتبالیست

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1394

معصومه نجف پور, سید عنایت الله علوی, کوروش حیدری شیرازی,

مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...

تنظیم خودکار سختی بازی‌های توان‌بخشی با استفاده از روش یادگیری تقویتی چندتناوبی (یاقوت)

ژورنال: مهندسی برق دانشگاه تبریز 2018

حسین زارعی, یونس سخاوت,

تحقیقات نشان داده است که طراحی فعالیت‌های توان‌بخشی در قالب بازی‌های جدی می‌تواند منجر به انگیزش بیش‌تر در بیماران شود. درجه سختی چنین بازی‌هایی معمولاً به‌صورت دستی توسط درمانگر تنظیم می‌شود. این در حالی است که بازی‌های توان‌بخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارت‌های بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازی‌های توان‌بخشی ارائه می‌کند که در آن سختی بازی به‌صورت ...

متن کامل

بهره گیری از بازخورد کاربر در روش های هوشمند تعاملی رتبه بندی اسناد وب

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه علم و هنر - دانشکده فنی 1393

هما خواجه, ولی درهمی, جواد پاک سیما,

امروزه رتبه بندی مبتنی بر یادگیری به مبحث تحقیقاتی مهمی در زمینه ی بازیابی اطلاعات تبدیل شده است. در حقیقت یک داستان یکسان برای روش های رتبه بندی اتفاق می افتد. در این داستان، هدف فراهم کردن مدل رتبه بندی بر طبق ارتباط بین اسناد و پرس وجو است که اسناد را به عنوان ورودی دریافت کند و لیست اسناد را بر حسب میزان مرتبط بودنشان به پرس وجوی کاربر مرتب کند. در این پایان نامه، سه الگوریتم رتبه بندی مبتن...

15 صفحه اول

ارائه روش یادگیری بصورت هایبرید با الهام از رفتار مغز در یادگیری یک فرایند جدید

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی 1387

سعید اقوامی, شهریار غریب زاده, فرزاد توحید خواه,

در سالیان اخیر با پیشرفت ابزارهای آزمایشگاهی و فن آوریهای نوین، شواهد تجربی یادگیری تقویتی و با سرپرستی که بعنوان تئوریهای پایه ای در علم یادگیری و کنترل حرکات ارادی شناخته می شوند، در حال ارائه هستند. در پایان نامه حاضر تلاش در جهت رسیدن به شناختی جامع از سیستم، جهت یادگیری کنترل حرکات با عنایت به یادگیری تقویتی و نیز یادگیری با سرپرستی بصورت مدل معکوس و نقش آنها در حفظ موقعیت و حرکت به انجام ...

15 صفحه اول

روش ترکیب طبقه‌بند مبتنی بر الگوریتم ژنتیک چندهدفه با به‌کارگیری معیارهای خطای طبقه‌بندی، پراکندگی، گوناگونی و تراکم

ژورنال: مهندسی برق دانشگاه تبریز 2018

بهزاد زمانی دهکردی, زهره نکویی شهرکی,

ترکیب طبقه‌بندها، یک روش مؤثر در یادگیری ماشینی است که در آن با ترکیب نتایج چند طبقه‌بند سعی می‌گردد تقریب بهتری از یک طبقه‌بند بهینه فراهم شود. برای آنکه ترکیب نتایج طبقه‌بندها مفید واقع شود باید طبقه‌بندهای پایه ضمن برخورداری از کارایی قابل قبول، دارای خطاهای متفاوتی باشند. همچنین بایستی قاعده مناسبی برای ترکیب خروجی طبقه‌بندهای پایه به کار گرفته شود. روش‌های متعدد ترکیب طبقه‌بندها ارائه شده ...

متن کامل

کاربرد روش یادگیری تفاوت زمانی در مهندسی کنترل

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تهران 1381

جواد عبدی, - کارولوکس, علی خاکی صدیق,

در طول سالیان گذشته ، تلاشهای زیادی در زمینه بهره برداری از یادگیری تقویتی به عنوان ابزار هوش مصنوعی و کنترل هوشمند صورت پذیرفته است و بر اثر موفقیت تحقیقاتی کاربرد یادگیری تقویتی در سیستم های کنترلی پردازشی ، تعداد زیادی از تحقیقات انجام یافته در دو دهه گذشته یادگیری عاطفی هم در سالهای اخیر دراین نوع کاربردها به طور موفقیت آمیز بکار برده شده است. هنگام تصمیم گیری در مورد چگونگی استفاده از سیگن...

15 صفحه اول

حل مسأله سیستم آونگ وارونه به روش یادگیری q فازی نوع ii فاصله ای

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

سید مرتضی هاشمیان, رضا منصفی,

آونگ وارونه مسأله ای کلاسیک در زمینه تئوری کنترل و دینامیک است و به طور گسترده به-عنوان معیاری برای تست الگوریتم های کنترل به کار می رود. مشکل اصلی کنترل آونگ وارونه، کنترل آنلاین این سیستم تحت شرایط متغیر محیطی و امکان تطبیق پذیری هر چه بهتر این سیستم با محیط است. از این رو روش های یادگیری تقویتی گزینه مناسبی برای رفع این گونه چالش ها به حساب می آید. یکی از موانع اصلی دربرابر سرعت و دقّت یادگیر...

15 صفحه اول

استفاده از تکنیک های یادگیری ماشین در پیاده سازی بازی های سه بعدی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1392

مهدی نیازی, حمید حسن پور, بهروز مینایی, علی سبطی,

در این پایان نامه از یادگیری تقویتی برای پیدا کردن یک سیاست مناسب جهت رفع مشکل موجود در بازی های امروزی که سطح سختی نامتناسب و عدم تطبیق پذیری بازی، با قابلیت های بازیکنان می باشد استفاده کرده-ایم. عامل یادگیرنده بازی که از روش یادگیری تطبیقی dyna بهره می برد با بکار بردن تابع عمل-ارزش و دریافت پاداش، شروع به درک محیط اطراف خود می کند و در ادامه، مبحث انتخاب و سازماندهی ویژگی ها، اعمال و پاداش ...

15 صفحه اول