استفاده از یادگیری تقویتی برای تشکیل ائتلاف های پویا در شبکه های حسگر نیمه مشارکتی

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی
نویسنده سارا امینی
استاد راهنما محسن افشارچی بهرام صادقی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1392

چکیده

امروزه شبکه های حسگر در بسیاری از پروژه های نظامی و امنیتی کاربرد دارند. گرچه هنوز بسیاری از این شبکه ها از کنترل کننده های مرکزی و معماری ترکیب مرکزی استفاده می کنند، علاقه مندی فزاینده ای از دهه ی گذشته برای کاهش نقش عامل مرکزی به دلیل محدودیت های اعمال شده ی آن در میان محققین پدید آمده است. برخی از این محدودیت ها عبارتند از: نیاز به پهنای باند ارتباطی زیاد، ترافیک بالای پیام ها در یک نقطه از شبکه، از کار افتادگی کل سیستم و از دست دادن کلیه ی دانش از موقعیت سیستم به دلیل نقص در عامل مرکزی و ... . به علاوه، امروزه فناوری پردازشی حسگرها بسیار پیشرفته شده و قیمت آن ها کاهش یافته است و همین امر متخصصین را بر آن داشته است که به تک حسگرها وظایفی بیش از تنها جمع آوری و ارسال داده های خام بدهند. در یکی از این پروژه ها برای تخصیص پهنای باند ارتباطی محدود در یک شبکه ی حسگر، مکانیسمی بر مبنای vcg ارائه شد که سازگار با انگیزه، کارا و از لحاظ فردی منطقی بود. مهمترین نقطه ضعف این پروژه وجود یک عامل مرکزی بود که فرآیند تخصیص به دست وی صورت می گرفت و نویسندگان در بخش پژوهش های آتی، یک جهت کاری را توزیع کردن نقش این عامل مرکزی عنوان کردند. در کار ما فرض بر این است که حسگرها مالکین مختلفی دارند و به همین دلیل احتمالاً اهداف متفاوتی هم دارند. محیط به صورت یک بازی احتمالاتی مدل شده است و به منظور تشویق عامل ها به همکاری با یکدیگر به آن ها یک ابزار داده شده است. این ابزار یادگیری تقویتی (rl) و نیز تابعی از آن به نام فاکتور اعتماد است. برای توزیع کردن نقش عامل مرکزی به عامل ها فرصت داده شد تا با مذاکره بهترین ائتلاف ممکن را برای پیوستن بیابند. پروتکل حاکم بر مذاکره، «پروتکل امتیازدهی یکنوا» است که پارامترهای آن بر اساس خروجی rl تعیین می گردد، بنابراین عامل ها یک مذاکره ی آگاهانه خواهند داشت. این بدین معناست که آن ها در مذاکره از تاکتیک های متفاوتی استفاده می کنند و پارامترهای هر تاکتیک را بر اساس شایستگی حریف (که از طریق rl یاد گرفته می شود) تعیین می کنند. در این پایان نامه، همچنین به کمک خروجی rl، یک مفهوم اعتماد تعریف شده که به کمک آن خود عامل (و نه یک عامل مرکزی) قادر است با دقت بالایی عامل های خودخواه را در سیستم شناسایی کرده و نسبت به حذف آن ها از فضای جستجویش اقدام کند. این روش هم سرعت اجرای هر گام rl را بالا می برد و هم از اتلاف منابع (cpu، انرژی، رادار و پهنای باند) عامل جلوگیری می کند.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

استفاده از یادگیری تقویتی بیزین برای تشکیل ائتلاف پویا در شبکه برق هوشمند

در شبکه برق هوشمند عامل های تولیدکننده خواهان تشکیل ائتلاف برای رسیدن به سود بیش تر هستند. اما عامل های تولیدکننده نسبت به توانایی هم برای تولید انرژی دانش کاملی ندارند و سعی دارند با تکرار روند تشکیل ائتلاف دانش جزئی خود را کامل کنند و برای این هدف از روش یادگیری تقویتی بیزین استفاده می کنند تا دانش خود را به درستی به روز رسانی کنند و به سود بیشتری در نهایت دست پیدا کنند.

15 صفحه اول

تقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی

مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...

متن کامل

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

متن کامل

ائتلاف های راهبردی و شبکه های مشارکتی؛ ظهور الگوی جدید در صنعت رسانه

تحولات فزاینده در صنعت رسانه، مدیریت شرکت های فعال در این صنعت را به طور کامل دگرگون کرده است. در گذشته، شرکت های رسانه ای، بنگاه های بزرگی بودند که کلیه فرایندهای ایجاد ارزش را درون سازمان خود ایجاد می کردند اما امروزه با پدید آمدن شرکت هایی از صنایع غیر رسانه ای و گسترش حضور رسانه ها در عرصه های جدید، امکان اجرای تمام مراحل تولید آثار رسانه ای، تنها از طریق یک شرکت، از میان رفته است و شرکت ها...

متن کامل

ارزیابی داده های خروجی از حسگر اندازه گیر بلادرنگ رطوبت خاک با استفاده از شبکه عصبی

محتوای رطوبتی خاک،یکی از مهمترین ویژگی‌های فیزیکی تاثیر گذار بر تولیدات کشاورزی می باشد. استفاده از حسگرهای خازنی، روشی برای تخمین محتوای رطوبت خاک می باشد. در این روش، خاک به عنوان بخشی از دی الکتریک حسگر خازنی محسوب می شود. در این تحقیق، داده های خروجی از یک حسگر خازنی که به شکل فرکانس بودند توسط شبکه عصبی مورد برازش قرار گرفته و با نتایج حاصل از رگرسیون مقایسه شدند. در ارزیابی استاتیکی داده ...

متن کامل

مسیریابی مبتنی بر اعتماد در شبکه های حسگر بی سیم با استفاده از منطق فازی

شبکه‌های حسگر بیسیم، حوزه‌ی پرکاربردی از نسلهای شبکه با پتانسیل بالا در محیط‌های غیرقابل پیش‌بینی و پویا است. با این حال، این شبکه‌ها به دلیل رسانه‌ی باز خود، توپولوژی در حال تغییر و پویا و الگوریتم‌های مسیریابی آن آسیب‌پذیر است . شبکه‌های موردی و شبکه‌های بی‌سیم ویژگی‌های مختلف مثل خود سازمان‌دهی پویا، خود پیکربندی، خود تصحیحی، نگه‌داری آسان، مقیاس‌پذیری بالا و سرویس‌های مطمئن را پشتیبانی می...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی

کلمات کلیدی

شبکه ها ی حسگر توزیع یافته یادگیری تقویتی چندعامله تخصیص منابع توزیع یافته

میزبانی شده توسط پلتفرم ابری doprax.com