نتایج جستجو برای: Q-learning

تعداد نتایج: 717428  

Journal: :مدیریت زنجیره تأمین 0
زهره کاهه رضا برادران کاظم زاده

in this paper, tender problems in an automobile company for procuring needed items from potential suppliers have been resolved by the learning algorithm q. in this case the purchaser with respect to proposals received from potential providers, including price and delivery time is proposed; order the needed parts to suppliers assigns. the buyer’s objective is minimizing the procurement costs thr...

2016
Takehiro Kitao Takao Miura

あらまし 本研究では,強化学習の代表的な手法の Q学習を使用して,追跡問題のための学習速度の向上手法を提案 する.本研究のアイデアは,鏡像による対称性を利用して,フィールドの Q値を学習することにある.このことで左 右の対象差のみを伴う学習をすることが可能である.また,Q値の同時更新による収束性についても論じる. In this investigation we propose how to accelerate Q-learning which is one of the most successful reinforcement learning methods using mirror images for hunting problems. Mirror images have symmetric differences on right and left views, th...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388

بازار برق به عنوان یک سیستم اقتصادی که با انسان و رفتارهای غیرخطی او دست به گریبان است و همچنین با توجه به دینامیک، قیود فیزیکی و پیچیدگی های سیستم قدرت، همواره مورد توجه محققان بوده است. برای حل مسائل پیچیده استفاده از سیستم های هوشمند که قابلیت ترکیب روش های یادگیری و دانش های مختلف از منابع متفاوت را دارند ضروری است. از جمله سیستم های هوشمند می توان به شبکه های عصبی مصنوعی، الگوریتم ژنتیک، ا...

1996
Jörg Bruske Ingo Ahrns Gerald Sommer

2012
Majed Alhajry Faisal Alvi Moataz Ahmed

2001
Katsunari SHIBATA Tetsuo NISHINO Yoichi OKABE

あらまし Q-learning と Actor-Critic アーキテクチャ の Actor を組み合わせた Actor-Q アーキテクチャと それを用いた能動認識学習システムを提案する.Actor-Q アーキテクチャは,システムの出力を,離散的な意思 である「行動」と連続値である「動作」に区別し,まず,Q値を用いて「行動」を決定し,その「行動」が「動作」 を伴う場合には,さらに,該当する Actor の出力にしたがって「動作」を行う.そして,Q値は,Q-learning で学習し,Actor は,その「行動」に対応するQ値を Criticの出力として学習を行なう. ここでは,センサの移動および各パターンであるという認識の結論を下すことを行動とし,それぞれに Q値を割 り当てる.そして,センサの移動が選択された際は,Actor の出力にしたがってセンサを移動する.認識が選択 された場...

Journal: :Machine Learning 1992

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید