نتایج جستجو برای: الگوریتم یادگیری تقویتی

تعداد نتایج: 41353  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی فناوریهای نوین 1394

در دهه اخیر هوشمندسازی ربات ها مورد توجه بسیاری از پژوهشگران در زمینه مهندسی رباتیک و هوش مصنوعی قرار گرفته است. از چالش های پیشروی پژوهشگران در این زمینه ساخت ربات هایی است که دارای قابلیت یادگیری و تطبیق پذیری باشند. هدف از این پایان نامه استفاده از روش های یادگیری تقویتی برای طراحی مسیر بهینه برای ربات ها می باشد. در این مطالعه روشی نو برای یادگیری مسیر بهینه حرکت ربات های بازو از طریق تعامل...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391

یادگیری تقویتی به عنوان یکی از روش های یادگیری ماشین بی نیاز به مدل، در دهه اخیر بیشتر مورد توجه محققین واقع شده است. توانایی یادگیری از طریق تعامل و بدون نیاز به راهنما، مشخصه اصلی این روش یادگیری می باشد. بسیاری از روش های سنتی یادگیری تقویتی، فقط در محیط های حالت و عمل گسسته و کوچک کارامد هستند. علاوه براین وجود نویز در محیط و تاخیر در دریافت پاداش توسط عامل، کارایی این روشها را محدود می ساز...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1390

مشارکت کلید اصلی رسیدن به موفقیت در سیستم های طبیعی و مصنوعی به شمار می رود و از این رو مشارکت در سیستم های چندعامله به منظور رسیدن به راه حل های بهتر ضروری به نظر می رسد. انتظار می رود که یادگیری مشارکتی چندعامله در مقایسه با یادگیری مستقل عامل ها، به دلیل دارا بودن دانش و منابع اطلاعاتی بیشتر به نتایج بهتری از نظر کیفی و سرعت یادگیری دست یابد. استفاده از استراتژی های مشارکت بهتر منجر به افزای...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و الکترونیک 1392

هدف اصلی شبکه های شناختگر، استفاده بهینه و انعطاف پذیر از پهنای باند فرکانسی است. با توجه به این هدف، کاربرهای جدیدی برای شبکه تعریف می شود. این کاربرها به کمک شبکه شناختگر می توانند منابع فرکانسی را به بهترین نحو مورد استفاده قرار دهند. یکی از وظایف شبکه های شناختگر، عملیاتی تحت عنوان "دستیابی به طیف" است. این عملیات شامل دو مرحله است. یکی حس کردن کانال به منظور یافتن ناحیه هایی از طیف که مورد...

پایان نامه :دانشگاه تربیت معلم - تهران - دانشکده مهندسی کامپیوتر 1391

انتخاب کنش خوب، موضوع اصلی در هر گام تصمیم گیری برای رسیدن به موفقیت در سیستم های طبیعی و مصنوعی به شمار می رود و از این رو انتخاب کنش خوب در سیستم های نیمه رویت پذیر به منظور رسیدن به راه حل های بهتر، ضروری به نظر می رسد. اکثر تحقیقات در حوزه یادگیری ماشین نیز بر دو پایه اصلی بهبود کیفیت و کاهش زمان یادگیری متمرکز هستند. یکی از روش های موجود برای یادگیری در حوزه یادگیری تقویتی، الگوریتم تکرار ...

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

ژورنال: جاده 2018
امین نوری, علیرضا عربی

یکیازمهمتریناهدافپژوهشدرحوزهحملو نقل،بهینهکردنجریان­های ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابعارائهشدهتوسطزیرساخت­هایفعلیو ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه محقق اردبیلی - دانشکده فنی 1393

بحث کنترل ازدحام از اهمیت ویژه ای در مباحث مربوط به شبکه های کامپیوتری برخوردار است. کنترل ناکارآمد ازدحام در شبکه، به آسانی منجر به از کار افتادن شبکه می-شود. یادگیری تقویتی که از داده ها می آموزد همراه با سیستم استنتاج فازی، ابزار هایی عالی برای حل مشکل کنترل ازدحام در شبکه های کامپیوتری با آن طبیعت پیچیده اش هستند.aimd هسته ی مکانیزم اجتناب از ازدحام برای این استاندارد های tcp است. در حالت ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386

برای بسیاری سیستم ها، توانایی یادگیری یک مزیت مهم و حتی در بعضی موارد یک نیاز است. از ابتدا، برای ایجاد توانایی یادگیری دو ایده کلی بسیار مورد توجه بوده است. ایده اول که به یادگیری با نظارت منجر می شود، استفاده از زوج های آموزشی ورودی-خروجی است. در این نوع یادگیری، سعی بر آموزش عملکرد درست به سیستم، با تعدادی مثال است که هر مثال شامل خروجی مورد انتظار از سیستم برای یک ورودی معین است. ایده دیگر ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشکده علوم اقتصادی 1391

در این پایان نامه مساله مبادله سهام شامل تعیین زمان خرید، قیمت خرید، زمان فروش و همچنین قیمت فروش سهام را با استفاده از روش یادگیری تقویتی که با نامهای دیگری مانند برنامه ریزی پویای مبتنی بر شبیه سازی نیز شناخته می شود، مدل می کنیم تا از این طریق سیاستی مناسب برای انجام مبادلات روی سهام بیابیم و سبدی از سهام را به صورت پویا و فعال به منظور بیشینه سازی سود حاصل از سرمایه گذاری مدیریت کنیم. مدله...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید