نام پژوهشگر: کیکاوس گزمه
کیکاوس گزمه حسن رضایی
بدون شک بانک ها و موسسات مالی یکی از مهمترین ستون های هر اقتصاد پویا و پایدار هستند. یکی از معروفترین ریسک های جاری در بانکها ریسک اعتباری می باشد. امروزه بانکها داده ها و متغیر های زیادی از سوابق مشتریان را در پایگاه های داده ای خود ذخیره می کنند. داده کاوی استخراج دانش سودمند از این اطلاعات است. یکی از مسائلی که در داده کاوی موجب افزایش صحت، دقت و تعمیم پذیری مدل های تولید شده می گردد، پیش پردازش و آماده سازی مجموعه داده ها می باشد. بدین ترتیب هدف اصلی این تحقیق استفاده از روش های مختلف پیش پردازش و رده بندی داده کاوی و مقایسه آنها، به منظور افزایش دقت مدل های اعتبارسنجی می باشد. ازسه روش انتخاب ویژگی relief ، سود اطلاعاتی و الگوریتم ژنتیک به عنوان یکی از موثرترین راه کارها به منظور افزایش دقت مدلسازی ها و همچنین کاهش هزینه های محاسباتی استفاده شده است. از طرف دیگر با توجه به وجود مسئله رده های نامتوزان در اکثر مجموعه داده های موجود در حوزه اعتبارسنجی، از روش های رده بندی جمعی مانند بگینگ، بوستینگ و استکینگ با استفاده از برخی روش های پایه مطرح از قبیل: بیز ساده، درخت تصمیم، شبکه های عصبی مصنوعی، رگرسیون لجستیک و ماشین بردار پشتیبان، به منظور مدلسازی استفاده شده است.در نهایت هفده روش مدلسازی بر روی سه مجموعه داده که بر اساس سه روش انتخاب ویژگی تهیه شده بودند، اجرا گردید. نتایج حاکی از این مطلب است که به طور میانگین مدلسازی بر روی مجموعه متغیرهای انتخاب شده توسط روش الگوریتم ژنتیک، توسط هر هفده روش از نظر شاخص های دقت، کاپا، شاخص f و auc نتیجه مناسب تر و بهینه تری را ارائه می دهد و از نظر شاخص دقت در این تحقیق، مدل ماشین بردار پشتیبان و بوستینگ آن موفق به کسب بیشترین دقت یعنی76/7 % شد ند که بدین ترتیب مدلسازی این تحقیق دارای بهبود قابل توجهی نسبت به سایر تحقیقات بوده است.