الگوریتم آتوماتای یادگیری تقویتی

مدیریت طیف در شبکه های رادیو شناختگر به کمک یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و الکترونیک 1392

احمد مبارکی, رضا قاضی زاده, حمید فرخی,

هدف اصلی شبکه های شناختگر، استفاده بهینه و انعطاف پذیر از پهنای باند فرکانسی است. با توجه به این هدف، کاربرهای جدیدی برای شبکه تعریف می شود. این کاربرها به کمک شبکه شناختگر می توانند منابع فرکانسی را به بهترین نحو مورد استفاده قرار دهند. یکی از وظایف شبکه های شناختگر، عملیاتی تحت عنوان "دستیابی به طیف" است. این عملیات شامل دو مرحله است. یکی حس کردن کانال به منظور یافتن ناحیه هایی از طیف که مورد...

15 صفحه اول

طراحی و پیاده سازی مدلهای محاسباتی مبتنی بر آتوماتای سلولی در کاربردهای موازی و توزیع شده

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388

سیدمعین شاکری, حسین دلداری, حسین یغمایی مقدم, معین شاکری,

امروزه آتوماتای سلولی در زمینه های متعددی از جمله تولید الگوهای تصادفی، نظریه محاسبات، مدلسازی سیستمهای فیزیکی و بیولوژیکی و محاسبات کاربردی مورد استفاده قرار گرفته است. طبق تعریف، می توان به آتوماتای سلولی به عنوان یک مدل محاسباتی عمومی نگریست که عملیات بر روی این مدل محاسباتی طبق قوانین سلولی صورت می پذیرد. از طرفی گرایشی در جامعه علمی برای نمونه سازی و حل مسائل پیچیده بهینه سازی بوسیله به ...

استفاده از روش رجحان به منظور حل مسائل یادگیری تقویتی در pomdps

پایان نامه :دانشگاه تربیت معلم - تهران - دانشکده مهندسی کامپیوتر 1391

الهه عبدی, میرمحسن پدرام,

انتخاب کنش خوب، موضوع اصلی در هر گام تصمیم گیری برای رسیدن به موفقیت در سیستم های طبیعی و مصنوعی به شمار می رود و از این رو انتخاب کنش خوب در سیستم های نیمه رویت پذیر به منظور رسیدن به راه حل های بهتر، ضروری به نظر می رسد. اکثر تحقیقات در حوزه یادگیری ماشین نیز بر دو پایه اصلی بهبود کیفیت و کاهش زمان یادگیری متمرکز هستند. یکی از روش های موجود برای یادگیری در حوزه یادگیری تقویتی، الگوریتم تکرار ...

15 صفحه اول

حذف نویز صوتی تناوبی با روش فعال و هوشمند

ژورنال: مکانیک سازه ها و شاره ها 2013

بهروز رئیسی, شاپور گلبهار حقیقی, علی اکبر صفوی,

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

متن کامل

کنترل ترافیک یک چهارراه راهنمایی رانندگی با استفاده از الگوریتم‌های یادگیری تقویتی (یادگیری-Q، سارسا و مسیرهای شایستگی)

ژورنال: جاده 2018

امین نوری, علیرضا عربی

یکیازمهمتریناهدافپژوهشدرحوزهحملو نقل،بهینهکردنجریانهای ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابعارائهشدهتوسطزیرساختهایفعلیو ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از...

متن کامل

روشی کارا برای کنترل ازدحام در شبکه های کامپیوتری با استفاده از یادگیری تقویتی فازی و نظریه بازی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه محقق اردبیلی - دانشکده فنی 1393

محمد باقر صفری پور فتیده, شهرام جمالی, مرتضی آنالویی,

بحث کنترل ازدحام از اهمیت ویژه ای در مباحث مربوط به شبکه های کامپیوتری برخوردار است. کنترل ناکارآمد ازدحام در شبکه، به آسانی منجر به از کار افتادن شبکه می-شود. یادگیری تقویتی که از داده ها می آموزد همراه با سیستم استنتاج فازی، ابزار هایی عالی برای حل مشکل کنترل ازدحام در شبکه های کامپیوتری با آن طبیعت پیچیده اش هستند.aimd هسته ی مکانیزم اجتناب از ازدحام برای این استاندارد های tcp است. در حالت ...

بررسی خصوصیات همگرایی روش های ترکیبی یادگیری تقویتی با تخمین تابع

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386

بابک به ساز, رضا صفابخش,

برای بسیاری سیستم ها، توانایی یادگیری یک مزیت مهم و حتی در بعضی موارد یک نیاز است. از ابتدا، برای ایجاد توانایی یادگیری دو ایده کلی بسیار مورد توجه بوده است. ایده اول که به یادگیری با نظارت منجر می شود، استفاده از زوج های آموزشی ورودی-خروجی است. در این نوع یادگیری، سعی بر آموزش عملکرد درست به سیستم، با تعدادی مثال است که هر مثال شامل خروجی مورد انتظار از سیستم برای یک ورودی معین است. ایده دیگر ...

15 صفحه اول

مدیریت پویای سبد سهام با استفاده از یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشکده علوم اقتصادی 1391

محمد خدادادی بهلولی, محمد مدرس یزدی, مسعود ماهوتچی,

در این پایان نامه مساله مبادله سهام شامل تعیین زمان خرید، قیمت خرید، زمان فروش و همچنین قیمت فروش سهام را با استفاده از روش یادگیری تقویتی که با نامهای دیگری مانند برنامه ریزی پویای مبتنی بر شبیه سازی نیز شناخته می شود، مدل می کنیم تا از این طریق سیاستی مناسب برای انجام مبادلات روی سهام بیابیم و سبدی از سهام را به صورت پویا و فعال به منظور بیشینه سازی سود حاصل از سرمایه گذاری مدیریت کنیم. مدله...

یادگیری تقویتی بر مبنای دوپامین به عنوان سیگنال مالتی پلکس شده یادگیری در رفتار مبتنی بر پاداش

پایان نامه :دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد شاهرود - پژوهشکده برق و کامپیوتر 1393

سید محمدرضا احمدپناهی, علی اکبر پویان,

پیشرفت های اخیر سعی در جایگزینی روبات به جای انسان کرده است. روبات ها برای جایگزینی نیاز به یادگیری دارند. با تکامل علوم جدید هر روز روبات ها، برای رسیدن به هدف مورد نظر، بدون نیاز به نظارت انسان پیشرفت می کنند. تاکنون تحقیقات زیادی در مورد یادگیری با نظارت و یا بر اساس مدل انجام شده است. پیدا کردن راهی برای رسیدن به کوتاه ترین مسیر موجود از مکان فعلی تا مقصد در محیط ناشناخته مشکل بزرگی در راه...

استفاده از یادگیری تقویتی در کنترل آرایش منظم عامل ها

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1393

یوسف مومنی, ولی درهمی, علی محمد لطیف,

این پایان نامه یک روش جدید یادگیری تقویتی برای ایجاد آرایش منظم عامل ها ارائه می دهد. آرایش منظم عامل ها به معنی قرارگرفتن آن ها در یک شکل منظم همچون مربع، مثلث، و هشت ضلعی می باشد. مسئله مذکور یک مسئله چند‍ عامله می باشد که در اینجا از روش های یادگیری برای حل آن استفاده می شود. اکثر کارهای گذشته در مورد آرایش منظم از یادگیری تقویتی یا به صورت تک عامله و یا در محیطی گسسته استفاده شده است، لذا د...