نام پژوهشگر: آتوسا گودرزی

the clustering and classification data mining techniques in insurance fraud detection:the case of iranian car insurance
thesis 0 1392
  سمیه احدی نانسا   غدیر مهدوی

با توجه به گسترش روز افزون تقلب در حوزه بیمه به خصوص در بخش بیمه اتومبیل و تبعات منفی آن برای شرکت های بیمه، به کارگیری روش های مناسب و کارآمد به منظور شناسایی و کشف تقلب در این حوزه امری ضروری است. درک الگوی موجود در داده های مربوط به مطالبات گزارش شده گذشته می تواند در کشف واقعی یا غیرواقعی بودن ادعای خسارت، مفید باشد. یکی از متداول ترین و پرکاربردترین راه های کشف الگوی داده ها استفاده از روش داده کاوی است. بسیاری از محققین با استفاده از روش های داده کاوی مدل هایی برای تشخیص و شناسایی بالقوه ی خسارت های غیرواقعی ایجاد و توسعه داده اند. در این رساله ما نیز با استفاده از تکنیک های داده کاوی مدل هایی برای کشف الگوهایی جهت تشخیص و پیش بینی تقلب در خسارت های ادعا شده ارائه داده ایم. در این رساله با استفاده از شیوه های داده کاوی، الگوهایی برای تشخیص و پیش بینی تقلب در مطالبات گزارش شده، ارائه شده است. بدین منظور ابتدا از الگوریتم خوشه بندی k-means برای گروه بندی مطالبات (شامل 11897 پرونده خسارت اتومبیل)، به دو گروه واقعی و غیر واقعی استفاده شده است. سپس با استفاده از همین ورودی و الگوریتم های طبقه بندی شامل درخت تصمیمc4.5 ، بیز ساده و شبکه های باورمندی بیزی، مدل هایی برای کشف الگوهایی جهت پیش بینی مشکوک به تقلب بودن نمونه جدید ارائه شده است. نتایج بدست آمده در این تحقیق نشان میدهد که نوع استفاده از وسیله نقلیه, مدل, نوع خسارت ادعا شده, میزان پوشش بیمه ای, فاصله زمانی بین تصادف و گزارش آن به شرکت بیمه و مدت زمان قرارداد(تعداد سالهای بدون خسارت) در بروز رفتارهای متخلفانه بسیار تاثیر گذار است.