نام پژوهشگر: سینا طباخی
سینا طباخی پرهام مرادی
امروزه کاربردهای واقعی طبقه بندی که مجموعه های داده ای با حجم زیاد تولید می کنند به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها، اغلب نامناسب و دارای افزونگی می باشند. این ویژگی ها می توانند تاثیر منفی بر روی عملکرد سیستم طبقه بندی داشته باشند. یک تکنیک مهم برای غلبه بر این مشکل، انتخاب ویژگی است. هدف انتخاب ویژگی، انتخاب زیرمجموعه ای از ویژگی های مناسب از بین مجموعه ویژگی های اولیه، برای بهبود دقت طبقه بندی است. معمولاً جستجوی جامع برای پیدا کردن زیرمجموعه ویژگی بهینه به لحاظ هزینه محاسباتی غیر ممکن است. بنابراین انتخاب ویژگی تبدیل به یک چالش عمده در شناسایی الگو و یادگیری ماشین شده است. در این پایان نامه، چهار روش انتخاب ویژگی جدید مبتنی بر راهکار فیلتر ارائه می شود. در روش اول، فضای جستجو به صورت گراف بازنمایی شده و سپس با استفاده از الگوریتم بهینه سازی کلونی مورچه ها مناسب بودن هر ویژگی تعیین خواهد شد. مزیت عمده روش پیشنهادی، استفاده از الگوریتم مبتنی بر هوش جمعی در راهکار فیلتر است که از هیچ طبقه بندی کننده ای در فرآیند انتخاب ویژگی استفاده نمی کند. همچنین شباهت مابین ویژگی ها در تعیین مناسب بودن آنها درنظر گرفته می شود که منجر به کاهش افزونگی خواهد شد. روش های پیشنهادی دیگر بر اساس روش پیشنهادی اول ارائه شده است. در روش پیشنهادی دوم، مناسب بودن هر ویژگی به تنهایی محاسبه شده و در فرآیند انتخاب ویژگی در نظر گرفته می شود. در روش پیشنهادی سوم، انتخاب ویژگی افزایشی معرفی می شود که در آن شباهت ویژگی جدید با زیرمجموعه ویژگی های انتخاب شده قبلی محاسبه می شود. در نهایت، مفهوم سرد شدن تدریجی برای کنترل تصادفی بودن الگوریتم بهینه سازی کلونی مورچه ها در روش پیشنهادی چهارم بکار برده شده است. عملکرد روش های پیشنهادی با 11 روش انتخاب ویژگی شناخته شده تک متغیره و چند متغیره، با استفاده از طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایشات کارایی روش های پیشنهادی و بهبود روش های انتخاب ویژگی قبلی را نشان می دهد. همچنین روش های پیشنهادی زیرمجموعه ویژگی های کوچکتری را نسبت به روش های دیگر پیدا می کنند.