نتایج جستجو برای: الگوریتم fuzzy sarsa

تعداد نتایج: 112094  

2015
Ruohan Zhang Zhao Song Dana H. Ballard

We propose a modular reinforcement learning algorithm which decomposes a Markov decision process into independent modules. Each module is trained using Sarsa(λ). We introduce three algorithms for forming global policy from modules policies, and demonstrate our results using a 2D grid world.

1998
Jette Randløv Preben Alstrøm

We present and solve a real-world problem of learning to drive a bicycle. We solve the problem by online reinforcement learning using the Sarsa( )-algorithm. Then we solve the composite problem of learning to balance a bicycle and then drive to a goal. In our approach the reinforcement function is independent of the task the agent tries to learn to solve.

Journal: :IEEE Transactions on Wireless Communications 2021

Non-orthogonal multiple access (NOMA) exploits the potential of power domain to enhance connectivity for Internet Things (IoT). Due time-varying communication channels, dynamic user clustering is a promising method increase throughput NOMA-IoT networks. This article develops an intelligent resource allocation scheme uplink communications. To maximise average performance sum rates, this work des...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید بهشتی - دانشکده مهندسی برق و کامپیوتر 1389

چکیده ندارد.

با پیشرفت روز افزون تکنولوژی­های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش­هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می­باشیم.  امروزه خوشه­بندی داده به عنوان یکی از روش­های آنالیز و ساده سازی مجموعه داده­های بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این میان خوشه­بندی سری­های زمانی با دقت مورد قبول، حائز اهمیت بسیاری می­باشد....

Journal: :Applied sciences 2022

Smart health systems typically integrate sensor technology with the Internet of Things, enabling healthcare to monitor patients. These biomedical applications collect data through remote sensors and transfer a centralized system for analysis. However, communication between edge node mobile user is susceptible impersonation attacks in computing (MEC) application. For this purpose, we propose det...

Journal: :International Journal of Electrical and Electronics Engineering 2021

Journal: :International journal of pharmaceutical chemistry and analysis 2023

Oxidative stress is defined as a condition in which the balance between production of reactive oxygen species (ROS) and antioxidant defense system gets disturbed causes free radical induced diseases. The current research was aimed to carrying out quantification phytochemicals different parts explores activities ethanolic extracts leaf (CFL), seed (CFS), bark (CFB) show their therapeutic importa...

شناسایی الگوها در داده‌های لرزه‌ای از طریق خوشه‌بندی، به‌عنوان یکی از رایج‌ترین روش‌های داده‌کاوی، منجر به استخراج اطلاعات بسیار مهمی از یک حجم زیاد داده ‌می‌شود. به دلیل ماهیت داده‌های لرزه‌ای، الگوریتم‌های خوشه‌بندی فازی نتایج واقع‌بینانه‌تری را ارائه می‌کنند. اگرچه الگوریتم‌های بسیاری بدین منظور ارائه‌شده است اما حساس بودن به مقادیر اولیه و به تله افتادن در جواب‌های بهینه محلی ازجمله مشکلاتی...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید