نام پژوهشگر: مژده گل آقا
مژده گل آقا بهروز مینایی
با رشد سریع حجم اطلاعات در جهان، ابزارهایی که در زمینه های مختلف دانش به کار می روند، باید برای مقابله با این رشد عظیم توسعه یابند. به طور سنتی، داده ها به صورت تحلیلی به دانش تبدیل می شده اند. برای بسیاری از کاربردها، این تحلیل های سنتی در داده ها، کند، هزینه بر و بسیار ذهنی است. در واقع همان طور که حجم داده ها افزایش می یابد، این گونه تحلیل ها بر روی داده ها در بسیاری زمینه ها غیرعملی می شود. در نتیجه نیاز به استفاده از روش های خودکار به وجود می آید. فرآیند کشف دانش، فرآیند شناسایی طرح های معتبر، بدیع، بالقوه مفید و قابل فهم در داده هاست که بخش بزرگی از آن را پیش پردازش داده ها تشکیل می دهد. یک گام مهم در پیش پردازش داده ها، انتخاب ویژگی است. ایده ی اصلی در انتخاب ویژگی، حذف زیرمجموعه ای از ویژگی های ورودی است که یا اطلاعات کمی به دست می دهند یا اطلاعاتی برای پیش بینی در اختیار ما نمی گذارند. انتخاب ویژگی علاوه بر بالابردن دقت و کارایی رده بندی، قابلیت درک نتایج حاصل از آن را بالا می برد و اغلب باعث ایجاد مدلی می شود که قابلیت تعمیم بیشتری برای داده های جدید دارد. با کاهش تعداد ویژگی ها، مجموعه داده کوچک تر می شود و این مجموعه داده باقیمانده، نماینده بهتری برای کل داده ها خواهد بود. انتخاب ویژگی یک مسئله بهینه سازی است و به دسته ی الگوریتم های np-hard تعلق دارد. الگوریتم های فرااکتشافی قدرت خود را درحل مسئله های بهینه سازی و np-hard نشان داده اند. در این پایان نامه پس از بررسی الگوریتم های فرااکتشافی جدید الهام گرفته از طبیعت و اجتماع، الگوریتم های جدیدی بر مبنای این الگوریتم ها، برای حل مسئله انتخاب ویژگی مطرح شده است. با مقایسه عملکرد الگوریتم های پیشنهادی با برخی دیگر از روش های معتبر در ادبیات موضوع، دقت و کارایی الگوریتم های پیشنهادی به اثبات رسیده است. در پایان، کاربرد انتخاب ویژگی در حل مسئله تجاری شناسایی فاکتورهای ریسک خسارت بیمه بدنه خودرو نشان داده شده است.