نتایج جستجو برای: الگوریتم fuzzy sarsa

تعداد نتایج: 112094  

ژورنال: :مجله دیابت و متابولیسم ایران 0
حسین فرضعلی وند hossein farzalivand khozestan, izeh, zagros street, izeh branch, islamic azad university, young researchers club phone: 09384221895خوزستان، ایذه، خیابان زاگرس، میدان دانشجو، دانشگاه آزاد اسلامی واحد ایذه، باشگاه پژوهشگران و نخبگان تلفن: 09384221895

مقدمه: یکی از عوارض خطرناک بیماری دیابت نوع یک افزایش و کاهش ناگهانی سطح غلظت قند خون می باشد که باعث بروز خطراتی چون اغماء و بیهوشی خواهد شد. بنابراین استفاده از روش هایی با درصد خطای پایین و هوشمند با اطلاعات موجود در جهت پیش بینی و در نهایت پیشگیری از این عوارض،گام مهمی در جهت کنترل بهینه بیماری محسوب می شود. به همین منظور در این مقاله ما از الگوریتم ترکیبی fuzzy sarsa برای طراحی سیستم خبره ...

2006
Theodoros Theodoridis Huosheng Hu

This paper presents a novel Fuzzy Sarsa(λ) Learning (FSλL) approach applied to a strategic route leaning task of a mobile robot. FSλL is a hybrid architecture that combines Reinforcement Learning and Fuzzy Logic control. The Sarsa(λ) Learning algorithm is used to tune the rule-base of a Fuzzy Logic controller which has been tested in a route learning task. The robot explores its environment usi...

2005
L. Tokarchuk

This paper investigates two different approaches to learning using an agent electronic marketplace as test bed. The types of learning considered in this paper include the temporal difference (TD) learning algorithm Sarsa, and two new fuzzified versions of this algorithm, FQ Sarsa and Fuzzy Sarsa. We implement the three learning algorithms in an agent test bed in order to determine their usefuln...

2006
Laurissa N. Tokarchuk John Bigham Laurie G. Cuthbert

Reinforcement learning (RL) is a machine learning technique for sequential decision making. This approach is well proven in many small-scale domains. The true potential of this technique cannot be fully realised until it can adequately deal with the large domain sizes that typically describe real world problems. RL with function approximation is one method of dealing with the domain size proble...

Journal: :Appl. Soft Comput. 2016
Saloua Chettibi Salim Chikhi

In this paper, a dynamic fuzzy energy state based AODV (DFES-AODV) routing protocol for Mobile Adhoc NETworks (MANETs) is presented. In DFES-AODV route discovery phase, each node uses a Mamdani fuzzy logic system (FLS) to decide its Route REQuests (RREQs) forwarding probability. The FLS inputs are residual battery level and energy drain rate of mobile node. Unlike previous related-works, member...

Background: One of the serious complications of type 1 diabetes is a sudden increase and drop in blood glucose levels causing risks of anesthesia and coma. Thus, an important step towards the optimal control of the disease is to use intelligent methods with low error rate and available information in order to predict and prevent such complications. In this paper, a combined Fuzzy SARSA algorith...

2008
Vali Derhami Vahid Johari Majd Majid Nili Ahmadabadi

This paper provides a new Fuzzy Reinforcement Learning (FRL) algorithm based on critic-only architecture. The proposed algorithm, called Fuzzy Sarsa Learning (FSL), tunes the parameters of conclusion parts of the Fuzzy Inference System (FIS) online. Our FSL is based on Sarsa, which approximates the Action Value Function (AVF) and is an on-policy method. In each rule, actions are selected accord...

Journal: :Mathematical Problems in Engineering 2013

Journal: :Expert Syst. Appl. 2014
Mir Hesam Hajimiri Majid Nili Ahmadabadi Ashkan Rahimi-Kian

In this paper, an intelligent agent (using the Fuzzy SARSA learning approach) is proposed to negotiate for bilateral contracts (BC) of electrical energy in Block Forward Markets (BFM or similar market environments). In the BFM energy markets, the buyers (or loads) and the sellers (or generators) submit their bids and offers on a daily basis. The loads and generators could employ intelligent sof...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393

در این پایان نامه مسئله استراتژی قیمت¬دهی تولیدکنندگان انرژی در بازار یکنواخت برق برای رسیدن به حداکثر سود بررسی شده است. فروشندگان انرژی پیشنهادات قیمت خود را با بهره گیری از سه الگوریتم متفاوت q-learning، r-learning و sarsa برای یک ساعت مشخص از شبانه روز به اپراتور سیستم اعلام می کنند. الگوریتم های یادگیری تقویتی ذکر شده با روش انتخاب عمل تبرید تدریجی، ترکیب شده اند. سود بدست آمده برای فروشند...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید