نام پژوهشگر: مرضیه محرمخانی
مرضیه محرمخانی مجید مقدادی
مجموعه داده های سرطانی با ابعاد بالا، شامل تعداد زیادی از ویژگی ها می باشند که اکثر این ویژگی ها غیر مرتبط با مسئله مورد نظر هستند. از طرف دیگر در داده های سرطانی، علاوه بر بالا بودن تعداد ویژگی ها، تعداد نمونه های موجود بسیار اندک است. این مسئله می تواند تاثیر نامناسبی بر روی کارایی الگوریتم های دسته بندی داشته باشد. از این رو، انتخاب ویژگی قبل از عمل دسته بندی امری ضروری است. هدف اصلی الگوریتم های انتخاب ویژگی، انتخاب کمترین تعداد از ویژگی ها جهت رسیدن به دقت بالای دسته بندی است. در این پایان نامه، یک روش ترکیبی برای انتخاب ویژگی های مناسب ارائه شده است. الگوریتم ارائه شده شامل دو مرحله است. در مرحله اول، ویژگی ها بر اساس میزان ارتباط با همدیگر در گرو ه های مختلف قرار می گیرند. در مرحله دوم، از یک الگوریتم جستجو به منظور انتخاب ویژگی های مناسب استفاده می شود. الگوریتم جستجو، سعی در انتخاب ویژگی های غیر افزونه دارد. در این پایان نامه، از دو الگوریتم تکاملی جدید به منظور جستجوی کارآمد استفاده شده است. این دو الگوریتم، با الگوریتم ژنتیک مورد مقایسه قرار گرفته اند. اولین الگوریتم، الگوریتم فاخته است. در سال های اخیر، این الگوریتم به دلیل دقت بالا در پیدا کردن نتیجه مطلوب مورد توجه قرار گرفته است. دومین الگوریتم، الگوریتم بهینه سازی غیر جنسی است که به دلیل عدم نیاز به تنظیم پارامتر و عملگر انتخاب دارای سرعت و دقت بالایی می باشد. هر سه الگوریتم بر روی دو مجموعه داده ی colon و 9_tumor تست شده اند. نتایج بیانگر دقت بالای الگوریتم فاخته در مقایسه با الگوریتم ژنتیک و الگوریتم بهینه سازی غیر جنسی است. از طرفی مقایسه ی الگوریتم پیشنهادی با تعدادی از الگوریتم های موجود، نشان دهنده ی مطلوبیت الگوریتم پیشنهادی در مقایسه با برخی از این الگوریتم ها، از لحاظ دقت و تعداد ویژگی های انتخاب شده است.