نام پژوهشگر: مصطفی مرادخانی
مصطفی مرادخانی علی امیری
مسأله انتخاب ویژگی، یکی از مهمترین مسائل حوزه طبقه بندی داده ها است. هدف از انتخاب ویژگی، یافتن زیرمجموعه ویژگیهای موثرِ مجموعه داده ی اولیه، به منظور افزایش دقت وکاهش هزینه طبقه بندی داده ها است. در سال های اخیر با پیدایش مجموعه داده های با ابعاد بالا و تعداد نمونه کم، نیاز مبرم به وجود روش های انتخاب ویژگی های موثر احساس می شود. روش های مختلفی که برای انتخاب زیرمجموعه ویژگی ها ارائه شده اند علی رغم موفقیت هایی که کسب کرده اند، با مشکلاتی از قبیل ناپایداری، زمان همگرائی بالا و انتخاب یک راه حل نیمه بهینه به عنوان نتیجه نهایی مواجه بوده و نتوانسته اند به طور کامل ویژگی های موثر را استخراج نمایند. در این رساله روش پیوندی برای انتخاب ویژگی های موثر در مجموعه داده های با ابعاد بالا ارائه شده است. الگوریتم پیشنهادی در دو مرحله فیلتر و پوششی اجرا می شود. در مرحله ی فیلتر از معیار su برای وزن دهی به ویژگی ها استفاده شده است. سپس در مرحله ی پوششی با بهره گیری از الگوریتم رقابت استعماری فازی(fica)و الگوریتم iwssr، جستجوی ویژگی های موثر در فضای ویژگی های وزن دهی شده انجام می گیرد. روش ارائه شده با ده مجموعه داده ی استاندارد حوزه ی انتخاب زیرمجموعه ویژگی ها و سه مجموعه داده ی خورشیدی مورد ارزیابی قرار گرفته است. نتایج حاصل از آزمایشات نشان می دهد رهیافت پیشنهادی در مقایسه با روش های مشابه، علاوه بر بالا بودن میزان دقت، به زیرمجموعه ویژگی های فشرده تری دست یافته است. کلید واژه- مجموعه داده های ابعاد بالا؛ انتخاب زیرمجموعه ویژگی؛ الگوریتم رقابت استعماری فازی؛ طبقه بندی داده ها.