نام پژوهشگر: احمد مبارکی
احمد مبارکی رضا قاضی زاده
هدف اصلی شبکه های شناختگر، استفاده بهینه و انعطاف پذیر از پهنای باند فرکانسی است. با توجه به این هدف، کاربرهای جدیدی برای شبکه تعریف می شود. این کاربرها به کمک شبکه شناختگر می توانند منابع فرکانسی را به بهترین نحو مورد استفاده قرار دهند. یکی از وظایف شبکه های شناختگر، عملیاتی تحت عنوان "دستیابی به طیف" است. این عملیات شامل دو مرحله است. یکی حس کردن کانال به منظور یافتن ناحیه هایی از طیف که مورد استفاده قرار نمی گیرد. و دیگری اختصاص کانال های حس شده به کاربرهای جدید. برای بهینه کردن این دو مرحله مدیریت هایی در نظر گرفته می شود این مدیریت ها به روش های مختلفی پیاده سازی می شود که از جمله آن ها، پیاده سازی به کمک یادگیری تقویتی است. این روش می تواند بهبود قابل توجهی در بهینه سازی مدیریت طیف در شبکه های شناختگر ایجاد کند. در این پایان نامه با کمک گرفتن از یادگیری q که یکی از زیرمجموعه های یادگیری تقویتی است، سعی در بهینه سازی یک شبکه شناختگر نوعی می کنیم. این بهینه سازی از منظر حس کردن طیف بررسی می شود. این که چه کاربرهایی کدام کانال ها را و در چه زمانی حس کنند تا احتمال موفقیت آمیز بودن این عملیات بیشینه شود. کنترل شبکه در این پایان نامه به صورت متمرکز فرض شده است. مقالات مختلفی در زمینه ذکر شده چاپ شده است که در این تحقیق به تشریح سه نمونه از آنها می پردازیم. شبیه سازی بر اساس یکی از این مقالات انجام پذیرفته است. در این مقاله زمان به دوره های زمانی کوچک تری تقسیم می شود و تعداد محدودی از کاربران شبکه در هر دوره به حس کردن کانال ها می پردازند.