Q-learning

نتایج جستجو برای: Q-learning

تعداد نتایج: 717428 فیلتر نتایج به سال:

designing a procurement mechanism based on q-learning with an action-selection policy based on pso algorithm

Journal: :مدیریت زنجیره تأمین 0

زهره کاهه رضا برادران کاظم زاده

in this paper, tender problems in an automobile company for procuring needed items from potential suppliers have been resolved by the learning algorithm q. in this case the purchaser with respect to proposals received from potential providers, including price and delivery time is proposed; order the needed parts to suppliers assigns. the buyer’s objective is minimizing the procurement costs thr...

متن کامل

Accelerating Reinforcement Learning by Mirror Images

2016

Takehiro Kitao Takao Miura

あらまし本研究では,強化学習の代表的な手法の Q学習を使用して,追跡問題のための学習速度の向上手法を提案する.本研究のアイデアは,鏡像による対称性を利用して,フィールドの Q値を学習することにある.このことで左右の対象差のみを伴う学習をすることが可能である.また,Q値の同時更新による収束性についても論じる. In this investigation we propose how to accelerate Q-learning which is one of the most successful reinforcement learning methods using mirror images for hunting problems. Mirror images have symmetric differences on right and left views, th...

متن کامل

شبیه سازی بازار برق با استفاده از سیستمهای شناساگر یادگیرنده

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388

امیر فرزین, حبیب رجبی مشهدی,

بازار برق به عنوان یک سیستم اقتصادی که با انسان و رفتارهای غیرخطی او دست به گریبان است و همچنین با توجه به دینامیک، قیود فیزیکی و پیچیدگی های سیستم قدرت، همواره مورد توجه محققان بوده است. برای حل مسائل پیچیده استفاده از سیستم های هوشمند که قابلیت ترکیب روش های یادگیری و دانش های مختلف از منابع متفاوت را دارند ضروری است. از جمله سیستم های هوشمند می توان به شبکه های عصبی مصنوعی، الگوریتم ژنتیک، ا...

15 صفحه اول

Praticing Q-learning

1996

Jörg Bruske Ingo Ahrns Gerald Sommer

متن کامل

TD(λ) and Q-learning based Ludo players

2012

Majed Alhajry Faisal Alvi Moataz Ahmed

متن کامل

Active Perception Learning System Based on Actor-Q Architecture

2001

Katsunari SHIBATA Tetsuo NISHINO Yoichi OKABE

あらまし Q-learning と Actor-Critic アーキテクチャの Actor を組み合わせた Actor-Q アーキテクチャとそれを用いた能動認識学習システムを提案する.Actor-Q アーキテクチャは,システムの出力を,離散的な意思である「行動」と連続値である「動作」に区別し,まず,Q値を用いて「行動」を決定し,その「行動」が「動作」を伴う場合には,さらに,該当する Actor の出力にしたがって「動作」を行う.そして,Q値は,Q-learning で学習し,Actor は,その「行動」に対応するQ値を Criticの出力として学習を行なう. ここでは,センサの移動および各パターンであるという認識の結論を下すことを行動とし,それぞれに Q値を割り当てる.そして,センサの移動が選択された際は,Actor の出力にしたがってセンサを移動する.認識が選択された場...

متن کامل