نام پژوهشگر: مهرنوش ریسمانکارزاده
مهرنوش ریسمانکارزاده رضا افقی
در صنعت بیمه ، خصوصاً بیمه اتومبیل با حجم وسیعی از اطلاعات روبرو هستیم که در مسئله قیمت گذاری نمی توان این حجم بالای اطلاعات را پردازش نمود بر این اساس من از دو روش تحلیل مولفه اصلی و تحلیل مولفه اصلی عملکردی جهت تقلیل اطلاعات استفاده نموده ام. این دو روش داده ها را بدون آنکه از کیفیت آن ها کم شود به گروه کوچکتری تبدیل می کنند، که از داده های تقلیل یافته می توان میزان حق بیمه قابل پرداخت توسط بیمه شده را تعیین نمود. البته بنا بر تجارب گذشته تحلیل مولفه اصلی عملکردی تقلیل بهتری نسبت به تحلیل مولفه اصلی انجام می دهد که در این تحقیق هدف بررسی این موضوع می باشد. تحلیل مولفه اصلی در تعریف ریاضی یک تبدیل خطی متعامد است که داده ها را به دستگاه مختصات جدید می برد به طوری که بزرگترین واریانس داده بر روی اولین محور مختصات، دومین بزرگترین واریانس بر روی دومین محور مختصات قرار می گیرد و الی آخر. به این ترتیب مولفه هایی از مجموعه داده ها را که بیشترین تأثیر در واریانس را دارند حفظ می کند. برای ماتریس داده ها xt با میانگین تجربی صفر، که هر سطر یک مجموعه مشاهده و هر ستون داده های مربوط به یک شاخصه است، تحلیل مولفه اصلی به این صورت تعریف می شود : yt = xtw = v? به طوری که v?wt تجزیه مقدار های منفرد ماتریس xt می باشد . استفاده از تحلیل مولفه اصلی منوط به فرضهایی می باشد که باید در نظر گرفته شوند از جمله، فرض خطی بودن، فرض بر این که میانگین و کواریانس از نظر احتمالاتی قابل اتکا هستند، فرض بر این که واریانس شاخصه اصلی داده هاست. هدف از این تحلیل انتقال مجموعه داده x با ابعاد m به داده y با ابعاد l است. بنابرین فرض بر این است که ماتریس x از بردارهای تشکیل شده است که هر کدام به صورت ستونی در ماتریس قرار داده شده است. بنابرین با توجه به ابعاد بردارها (m) ماتریس داده ها به صورت است. میانگین تجربی? برداری است که به صورت زیر به دست می آید: که به طور مشخص میانگین تجربی روی سطرهای ماتریس اعمال شده است. سپس ماتریس فاصله تا میانگین به صورت زیر به دست می آید: b = x – uh که h برداری با اندازه با مقدار ? در هرکدام از درایه ها است. ماتریس کواریانس c با ابعاد به صورت زیر به دست می آید: به طوری که: میانگین حسابی است. ضرب خارجی است. ماتریس ترانهاده مزدوج ماتریس b است. در این مرحله، مقادیر ویژه و بردارهای ویژه ماتریس کواریانس، c، به دست می آید. v -1cv = d v ماتریس بردارهای ویژه و d ماتریس قطری است که درایه های قطر آن مقادیر ویژه هستند. همانطور که مشخص است? هر مقدار ویژه متناظر با یک بردار ویژه است. به این معنا که ماتریس v ماتریسی است که ستونهای آن بردارهای ویژه می باشند و بردار ویژه vq در ستون q ام قرار دارد و مقدار ویژه qام یعنی درایه? ?q = cq,q متناظر با آن است. بازچینی بردارهای ویژه بر اساس اندازه? مقادیر ویژه متناظر با آنها صورت می گیرد. یعنی بر اساس ترتیب کاهشی مقادیر ویژه، بردارهای ویژه بازچینی می شوند. یعنی انتخاب زیرمجموعه ای از بردارهای ویژه با تحلیل مقادیر ویژه صورت می گیرد. زیرمجموعه نهایی با توجه به بازچینی مرحله قبل به صورت انتخاب می شود. در اینجا می توان از انرژی تجمعی استفاده کرد که طبق آن انتخاب l باید به صورتی باشد که حداقل مقدار ممکن را داشته باشد و در عین حال g مقدار قابل قبولی داشته باشد. به طور مثال می توان حداقل l را انتخاب کرد که بنابرین خواهیم داشت: برای این کار ابتدا تبدیلات زیر را انجام می دهیم: ماتریس sm,1 انحراف معیار مجموعه داده است که می تواند به صورت زیر به دست بیاید: سپس داده به صورت زیر تبدیل می شود: که ماتریسهای c و b در بالا توضیح داده شده اند. داده ها می توانند به ترتیب زیر به فضای جدید برده شوند: روشی که بیان شد روش تحلیل مولفه اصلی بود، روش تحلیل مولفه اصلی عملکردی همانند روش تحلیل مولفه اصلی عمل می کند ولی تقلیل بهتری را ارائه می دهد این روش در ابتدا هموارسازی داده ها را انجام می دهیم و سپس داده ها را به مولفه اصلی عملکردی هماهنگ نشده تبدیل می نماییم.