نتایج جستجو برای: Q-learning
تعداد نتایج: 717428 فیلتر نتایج به سال:
in this paper, tender problems in an automobile company for procuring needed items from potential suppliers have been resolved by the learning algorithm q. in this case the purchaser with respect to proposals received from potential providers, including price and delivery time is proposed; order the needed parts to suppliers assigns. the buyer’s objective is minimizing the procurement costs thr...
あらまし 本研究では,強化学習の代表的な手法の Q学習を使用して,追跡問題のための学習速度の向上手法を提案 する.本研究のアイデアは,鏡像による対称性を利用して,フィールドの Q値を学習することにある.このことで左 右の対象差のみを伴う学習をすることが可能である.また,Q値の同時更新による収束性についても論じる. In this investigation we propose how to accelerate Q-learning which is one of the most successful reinforcement learning methods using mirror images for hunting problems. Mirror images have symmetric differences on right and left views, th...
بازار برق به عنوان یک سیستم اقتصادی که با انسان و رفتارهای غیرخطی او دست به گریبان است و همچنین با توجه به دینامیک، قیود فیزیکی و پیچیدگی های سیستم قدرت، همواره مورد توجه محققان بوده است. برای حل مسائل پیچیده استفاده از سیستم های هوشمند که قابلیت ترکیب روش های یادگیری و دانش های مختلف از منابع متفاوت را دارند ضروری است. از جمله سیستم های هوشمند می توان به شبکه های عصبی مصنوعی، الگوریتم ژنتیک، ا...
あらまし Q-learning と Actor-Critic アーキテクチャ の Actor を組み合わせた Actor-Q アーキテクチャと それを用いた能動認識学習システムを提案する.Actor-Q アーキテクチャは,システムの出力を,離散的な意思 である「行動」と連続値である「動作」に区別し,まず,Q値を用いて「行動」を決定し,その「行動」が「動作」 を伴う場合には,さらに,該当する Actor の出力にしたがって「動作」を行う.そして,Q値は,Q-learning で学習し,Actor は,その「行動」に対応するQ値を Criticの出力として学習を行なう. ここでは,センサの移動および各パターンであるという認識の結論を下すことを行動とし,それぞれに Q値を割 り当てる.そして,センサの移動が選択された際は,Actor の出力にしたがってセンサを移動する.認識が選択 された場...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید